Especialistas Seniores em Covid-19 com atuação no Brasil

Daniel Cardoso Moraes de Oliveira

Daniel de Oliveira é professor do Instituto de Computação da Universidade Federal Fluminense (IC/UFF) desde fevereiro de 2013. Recebeu o grau de Doutor em Engenharia de Sistemas e Computação pela COPPE/UFRJ em 2012 e o de Mestre em Engenharia de Sistemas e Computação em 2008, também pela COPPE/UFRJ. Desde 2013 lidera o Grupo de Pesquisa em eScience da Universidade Federal Fluminense (UFFeScience). É bolsista de produtividade nível 2 do CNPq desde 2016 e Jovem Cientista do Nosso Estado da FAPERJ também desde 2016. Seus interesses de pesquisa incluem ciência de dados, computação em nuvem, gerência de dados de proveniência, gerência de workflows científicos, paralelismo de dados, bioinformática e mineração de dados. Publicou mais de 200 artigos em periódicos indexados e em congressos nacionais e internacionais. Vem participando de Comitês de Programa de congressos nacionais e internacionais como o VLDB, IPAW, SBBD, além de ser revisor ad-hoc de revistas nacionais e internacionais. Sócio da SBC, IEEE e ACM. Já coordenou/coordena diversos projetos de pesquisa aprovados por órgãos de fomento. Entre eles, cabe destacar: 2 Projetos Universais CNPq, 1 Projeto "Grupos Emergentes FAPERJ", 1 Projeto "APQ1 FAPERJ" e 2 Projetos "Jovem Cientista do Nosso Estado FAPERJ", nas áreas de workflows científicos em ambientes de paralelismo e gerência de dados de proveniência além de participar de diversos outros projetos financiados por agências de fomento. Publicou o livro "Data-Intensive Workflow Management for Clouds and Data-Intensive and Scalable Computing Environments" publicado pela Morgan & Claypool em 2019. Foi chair do comitê de programa do SBBD'2020 (co-chair), BreSci'14, BreSci'19, WPerformance'16, SBBD Demos'17, BSB'18 e BSB'19. Atualmente é coordenador da Comissão Especial de Biologia Computacional (CE-BioComp) da Sociedade Brasileira de Computação (2021-2022). Além disso, é editor associado do Journal of Information and Data Managment (JIDM) e do PeerJ Computer Science. Uniform Resource Identifiers para Daniel Cardoso Moraes de Oliveira Web page: https://www.ic.uff.br/~danielcmo/ Google Scholar Public URL: https://scholar.google.com.br/citations?hl=enuser=T_YePXEAAAAJauthuser=2# DBLP search: https://dblp.org/pid/68/7553-1.html Open Researcher & Contributor ID (ORCID): https://orcid.org/0000-0001-9346-7651 Thomson Reuters ResearcherID: https://publons.com/researcher/3601485/daniel-de-oliveira/ Semantic Scholar: https://www.semanticscholar.org/author/Daniel-de-Oliveira/33663874 (Texto informado pelo autor)

  • https://lattes.cnpq.br/0743793296062293 (22/10/2021)
  • Rótulo/Grupo:
  • Bolsa CNPq: Nível 2
  • Período de análise:
  • Endereço: Universidade Federal Fluminense, Centro Tecnológico, Instituto de Computação. Rua Passo da Pátria 156 - Prédio do Instituto de Computação - Sala 508 São Domingos 24210240 - Niterói, RJ - Brasil Telefone: (21) 26295669 URL da Homepage: www.ic.uff.br/~danielcmo
  • Grande área: Ciências Exatas e da Terra
  • Área: Ciência da Computação
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (22)
    1. 2020-Atual. Uma proposta para interoperabilidade de dados na nuvem - Programa de Desenvolvimento de Projetos Aplicados
      Descrição: No mundo moderno onde as informações circulam com uma rapidez fantástica, existe a necessidade de sistemas mais inteligentes e interligados que produz conhecimento para assessoramento dos gestores, de forma clara, precisa, concisa e rápida, na tomada de decisão. É no nível do município, onde seus moradores procuram ganhar a vida, existe a necessidade crescente e ao mesmo tempo, crucial que seus gestores tenham em mãos informações corretas e completas. Esta pesquisa pretende analisar a integração dos sistemas do município e principalmente, sua interoperabilidade, de forma que o conhecimento produzido possa ser empregado estrategicamente, taticamente e operacionalmente em benefício dos moradores e para uma gestão mais eficiente. Este projeto tem por objetivo propor um modelo de interoperabilidade que permita a transformação de dados originados de diferentes sistemas para um modelo genérico de dados utilizando recursos de computação em nuvem, visando automatizar e ampliar a interoperabilidade dos sistemas e minimizar o custo monetário e/ou o tempo de comunicação entre os sistemas. Este modelo genérico seria obtido através do uso de técnicas de representação do conhecimento para gerar ontologias que atendam aos diferentes padrões de dados provenientes dos sistemas. O conjunto de ferramentas consiste de aplicações capazes de converter os padrões de diferentes dados no modelo genérico e uma API e/ou modelo para a incorporação de novos padrões de dados de forma dinâmica. Dessa forma, com os recursos disponibilizados online seria possível criar uma base de conhecimento dinâmica que armazena informações de sistemas antigos e novos. Além disso, o conjunto de ferramentas disponíveis em sistemas computacionais em nuvem garante a disponibilidade e integração de dados para que possam ser consumidos por novos sistemas que beneficiem o setor público. Os custos seriam flexíveis de acordo com a demanda de recursos necessários para os sistemas integrados. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) . Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Eugene Francis Vinod Rebello - Integrante / Cristina Boeres - Integrante / Bruno Lopes Vieira - Integrante / Leandro Santiago de Araújo - Coordenador / Geiza Maria Hamazaki da Silva - Integrante.
      Membro: Daniel Cardoso Moraes de Oliveira.
    2. 2020-Atual. Niteroi organizada e segura: estudo do impactos das chuvas - Programa de Desenvolvimento de Projetos Aplicados
      Descrição: Estudos recentes das ONU apontam que 68% da população mundial viverá em regiões urbanas até 2050. Um dos grandes desafios gerados pelo aumento da população das grandes cidades é a criação de políticas públicas de controle do processo de urbanização. Se por um lado regiões urbanas que crescem de forma estruturada gerenciam melhor seus recursos e serviços, e oferecem melhor qualidade de vida a sua população, regiões que evoluem desordenadamente usualmente enfrentam problemas com transportes públicos, trânsito, enchentes, deslizamentos de encostas, etc. Os problemas ocasionados pela urbanização desordenada podem ser estudados por meio de diversos indicadores, presentes não apenas nos conjuntos de dados disponibilizados pelas prefeituras e prestadoras de serviços de grandes centros urbanos, mas também em conjuntos de dados alternativos como os de redes sociais, aplicativos de celular, etc. Neste projeto, usaremos dados da prefeitura e de fontes alternativas para estudar problemas ocasionados pelas chuvas na cidade de Niterói. Utilizaremos conhecimentos das áreas de Engenharia de Dados, Inteligência Artificial, Otimização e Visualização de Informação para produzir estudos que apoiem os três principais focos de atuação do pilar ?A Niterói que Queremos Será: Organizada e Segura? do planejamento estratégico ?Niterói Que Queremos?: mobilidade urbana, infraestrutura e segurança. Neste contexto, tentaremos responder questões como: Qual o impacto das chuvas no trânsito da cidade? Quais as áreas da cidade mais afetadas por grandes volumes de chuva? Como chuvas interferem nas rotas de policiamento e na ocorrência de crimes?. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (3) / Especialização: (0) / Mestrado acadêmico: (2) / Mestrado profissional: (0) / Doutorado: (0) . Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Isabel Rosseti - Integrante / Marcos Lage - Coordenador / Aline Paes - Integrante / Yuri Frota - Integrante / Antônio Augusto Aragão Rocha - Integrante / Lhaylla Crissaff - Integrante. Financiador(es): Prefeitura Municipal de Niterói - Cooperação.
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: Estudos recentes das ONU apontam que 68% da população mundial viverá em regiões urbanas até 2050. Um dos grandes desafios gerados pelo aumento da população das grandes cidades é a criação de políticas públicas de controle do processo de urbanização. Se por um lado regiões urbanas que crescem de forma estruturada gerenciam melhor seus recursos e serviços, e oferecem melhor qualidade de vida a sua população, regiões que evoluem desordenadamente usualmente enfrentam problemas com transportes públicos, trânsito, enchentes, deslizamentos de encostas, etc. Os problemas ocasionados pela urbanização desordenada podem ser estudados por meio de diversos indicadores, presentes não apenas nos conjuntos de dados disponibilizados pelas prefeituras e prestadoras de serviços de grandes centros urbanos, mas também em conjuntos de dados alternativos como os de redes sociais, aplicativos de celular, etc. Neste projeto, usaremos dados da prefeitura e de fontes alternativas para estudar problemas ocasionados pelas chuvas na cidade de Niterói. Utilizaremos conhecimentos das áreas de Engenharia de Dados, Inteligência Artificial, Otimização e Visualização de Informação para produzir estudos que apoiem os três principais focos de atuação do pilar ?A Niterói que Queremos Será: Organizada e Segura? do planejamento estratégico ?Niterói Que Queremos?: mobilidade urbana, infraestrutura e segurança. Neste contexto, tentaremos responder questões como: Qual o impacto das chuvas no trânsito da cidade? Quais as áreas da cidade mais afetadas por grandes volumes de chuva? Como chuvas interferem nas rotas de policiamento e na ocorrência de crimes?. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (3) / Mestrado acadêmico: (2) . Integrantes: Aline Marins Paes Carvalho - Integrante / Daniel Cardoso Moraes de Oliveira - Integrante / Marcos Lage - Coordenador / Isabel Rosseti - Integrante / Yuri Frota - Integrante / Lhaylla Crissaff - Integrante / Antônio Augusto Aragão Rocha - Integrante. Financiador(es): Prefeitura Municipal de Niterói - Auxílio financeiro.
      Membro: Aline Marins Paes Carvalho.
    3. 2020-Atual. INRIA Associate Team: HPDaSc- High Performance Data Science
      Descrição: Data-intensive science requires the integration of two fairly different paradigms: high-performance computing (HPC) and data science. HPC is compute-centric and focuses on high-performance of simulation applications, typically using powerful, yet expensive supercomputers whereas data science is data-centric and focuses on scalability and fault-tolerance of web and cloud applications using cost-effective clusters of commodity hardware. In the context of the SciDISC project (associated team 2016-2019) and the INRIA Project Lab (IPL) HPC-BigData (2018-2022), we studied various architectures for integrating HPC and big data (post-processing, in-situ, in-transit) for applications in astronomy, life science and agronomy, and geoscience (oil & gas). We learned major lessons, which are the basis for this new project: * Importance of realtime analytics to make critical high-consequence decisions, e.g. preventing useless drilling based on a driller?s realtime data and realtime visualization of simulated data ; * Effectiveness of machine learning (ML) to deal with scientific data, e.g. computing Probability Density Functions (PDFs) over simulated seismic data using Spark; * Effectiveness of the Human-In-the-Loop (HIL) paradigm in combination with provenance data in scientific workflows, e.g. to avoid useless, long-duration computations in a supercomputer; * Significance of working closely with domain experts in order to interpret scientific data. This project addresses the grand challenge of High Performance Data Science (HPDaSc), by developing architectures and methods to combine simulation, ML and data analytics. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Alvaro Coutinho - Integrante / Fernando Rochinha - Integrante / Esther Pacitti - Integrante / Reza Akbarinia - Integrante / Rafaelli Coutinho - Integrante / Aline Paes - Integrante / Fabio Porto - Coordenador / Patrick Valduriez - Integrante / Kary Ocaña - Integrante / Eduardo Ogasawara - Integrante / Marta Mattoso - Integrante / Luiz Gadelha - Integrante / Dennis Shasha - Integrante / Florent Masseglia - Integrante / Christophe Pradal - Integrante / Alexis Joly - Integrante.
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: Data-intensive science requires the integration of two fairly different paradigms: high-performance computing (HPC) and data science. HPC is compute-centric and focuses on high-performance of simulation applications, typically using powerful, yet expensive supercomputers whereas data science is data-centric and focuses on scalability and fault-tolerance of web and cloud applications using cost-effective clusters of commodity hardware. In the context of the SciDISC project (associated team 2016-2019) and the Inria Project Lab (IPL) HPC-BigData (2018-2022), we studied various architectures for integrating HPC and big data (post-processing, in-situ, in-transit) for applications in astronomy, life science and agronomy, and geoscience (oil & gas). We learned major lessons, which are the basis for this new project: * Importance of realtime analytics to make critical high-consequence decisions, e.g. preventing useless drilling based on a driller?s realtime data and realtime visualization of simulated data ; * Effectiveness of machine learning (ML) to deal with scientific data, e.g. computing Probability Density Functions (PDFs) over simulated seismic data using Spark; * Effectiveness of the Human-In-the-Loop (HIL) paradigm in combination with provenance data in scientific workflows, e.g. to avoid useless, long-duration computations in a supercomputer; * Significance of working closely with domain experts in order to interpret scientific data. This project addresses the grand challenge of High Performance Data Science (HPDaSc), by developing architectures and methods to combine simulation, ML and data analytics... Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Doutorado: (6) . Integrantes: Alvaro Luiz Gayoso de Azeredo Coutinho - Integrante / Esther Pacitti - Integrante / Fernando Alves Rochinha - Integrante / Eduardo Ogasawara - Integrante / Fabio Porto - Integrante / Patrick Valduriez - Coordenador / Reza Akbarinia - Integrante / Florent Masseglia - Integrante / Kary Ocaña - Integrante / Dennis Shasha - Integrante / Gabriel F. Barros - Integrante / Romulo Montalvao Silva - Integrante / Daniel Cardoso Moraes de Oliveira - Integrante / MATTOSO, MARTA - Integrante / Luiz M. R. Gadelha Junior - Integrante / Aline Paes - Integrante / Alexis Joly - Integrante / Christophe Pradal - Integrante / Rafaelli Coutinho - Integrante.
      Membro: Alvaro Luiz Gayoso de Azeredo Coutinho.
    4. 2019-Atual. Analise Online de Dados Cientificos em Ambientes de Computacao Escalavel e Intensiva em Dados
      Descrição: Áreas estratégicas para o desenvolvimento do Brasil e do Estado do Rio de Janeiro, como as da área de petróleo, meteorologia e biologia, são altamente dependentes do uso de simulações computacionais.Apesar dessas simulações poderem ser implementadas em programas monolíticos, a grande maioria é caracterizada pelo encadeamento de programas que executam modelos computacionais cada vez mais complexos (i.e., dataflows). Esses dataflows são frequentemente modelados e executados tanto por meio de scripts quanto de abstrações como workflows científicos. Por se tratarem de simulações de larga es-cala, as mesmas comumente consomem e produzem um grande volume de dados. Devido à esse volume, o processamento requer o uso de paralelismo e ambientes de Computação de Alto Desempenho (HPC).A convergência entre HPC e as tarefas de processamento e análise de dados científicos associados a esses dataflows tem se dado basicamente pelo uso de Ambientes de Computação em Escalável e Intensiva emDados (do inglês DISC - Data Intensive Scalable Computing). A convergência entre HPC e DISC e´ um tópico bastante recente de interesse da comunidade científica. Enquanto ambientes HPC concentram-seno alto desempenho das simulações, geralmente utilizando supercomputadores, os ambientes DISC são orientados a dados e são formados por clusters de máquinas de hardware comum. Exemplos de frameworks DISC incluem o Apache Spark e o Apache Hadoop. A implementação e execução de dataflows em ambientes DISC traz uma série de desafios que estão relacionados com a gerência de recursos em larga escala. Muitas vezes para que a simulação atinja a capacidade de processamento necessária para terminar em tempo hábil, e´ necessário que se utilize uma série de recursos heterogêneos como CPUs em um cluster e/ou GPGPUs. O uso de ambientes DISC requer novos algoritmos de fragmentação de dados e tarefas das simulações, de escalonamento, de gerência e análise de dados produzidos, de segurança, de tolerância a falhas e de agregação de resultados, além de testes de avaliação. O presente projeto propõe uma abordagem capaz de executar, gerenciar, monitorar, depurar dataflows e analisar os dados produzidos pelos mesmos.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador / Vanessa Braganholo - Integrante / Leonardo Murta - Integrante / Esther Pacitti - Integrante / Isabel Rosseti - Integrante / Marcos Lage - Integrante / Aline Paes - Integrante / Yuri Frota - Integrante / Kary Ocaña - Integrante / Marta Mattoso - Integrante / Javam de Castro Machado - Integrante / José Maria da Silva Monteiro Filho - Integrante / Ji Liu - Integrante / Marcos Bedo - Integrante / Victor Ströele de Andrade Menezes - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Bolsa.
      Membro: Daniel Cardoso Moraes de Oliveira.
    5. 2019-Atual. Apoio Computacional ao Desenho de Novas Drogas para Tratamento de Zika Usando Computacao em Larga-Escala Centrada em Dados - Edital Universal CNPq 2018 - R$ 40.000,00
      Descrição: O vírus da Zika (ZIKV) faz parte de um grupo de doenças emergentes infecciosas que afetam em especial habitantes de países em desenvolvimento, incluindo o Brasil. O ZIKV é o responsável por graves anomalias congênitas em bebês, em especial a microcefalia. Dessa forma, para a populac?a?o desses pa??ses, a descoberta de novas drogas que possam ser usadas como tratamento para o ZIKV e? uma prioridade. Embora o Brasil tenha avanc?ado significativamente na u?ltima de?cada em va?rios campos da cie?ncia, as pesquisas em a?reas multidisciplinares como a bioinforma?tica ainda se encontram em amadurecimento, e estas desempenham um papel fundamental para a descoberta de novas drogas para o tratamento do ZIKV. Diversas pesquisas de sucesso no ramo da bioinforma?tica te?m proposto protocolos in silico (baseado em simulac?o?es computacionais) que utilizam ana?lises filogene?ticas/filogeno?micas e mais recentemente as ana?lises farmacofilogeno?micas. Esses protocolos normalmente envolvem um conjunto de programas que executam simulac?o?es cient??ficas e que sa?o encadeados formando um fluxo coerente de atividades, ao qual denominamos workflow. Entretanto, gerenciar um experimento nesse contexto na?o é ?uma tarefa trivial. Cada execuc?a?o de um workflow para descoberta de novas drogas para o ZIKV pode consumir e produzir um grande volume de dados, o que comumente requer o uso de ambientes de Processamento de Alto Desempenho (PAD), como clusters e supercomputadores, aliado a te?cnicas de paralelismo. Apesar de tais ambientes serem bastante utilizados, nos últimos anos temos visto o crescimento dos Ambientes de Computação em Larga Escala Centrada em Dados (DISC), que se baseiam em clusters de computadores de hardware comum, e seus frameworks associados como o Apache Spark que fornece processamento eficiente em memória. Um dos maiores desafios na gere?ncia de experimentos cient??ficos nesses ambientes DISC reside na distribuic?a?o das execuc?o?es das atividades dos workflows nos recursos de forma eficiente. Ale?m disso, devemos nos preocupar com a gere?ncia de metadados e com a ana?lise dos resultados obtidos, seja por meio de representação visual ou utilizando técnicas de aprendizado de máquina. O objetivo principal deste projeto de pesquisa esta? no desenvolvimento de novas te?cnicas de gere?ncia de experimentos cient??ficos baseados em simulac?a?o com o foco no apoio a? descoberta de novas drogas para o tratamento de ZIKV. Essa gere?ncia engloba a distribuic?a?o das simulac?o?es em ambientes DISC heteroge?neos (que envolvem nuvens de computadores, GPUs e clusters de computadores) e ana?lise dos resultados por meio de algoritmos de aprendizado de ma?quina e lo?gica. Todo o desenvolvimento sera? alicerc?ado em dados e processos reais fornecidos pela Fundação Oswaldo Cruz (FIOCRUZ) e pelo Laborato?rio Nacional de Bioinforma?tica (LabInfo) do Laborato?rio Nacional de Computac?a?o Cient?ífica.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (5) / Doutorado: (3) . Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador / Vanessa Braganholo - Integrante / Leonardo Murta - Integrante / Isabel Rosseti - Integrante / Aline Paes - Integrante / Cristina Boeres - Integrante / Lúcia Maria de Assumpção Drummond - Integrante / Yuri Frota - Integrante / Kary Ocaña - Integrante / Marta Mattoso - Integrante / Bruno Lopes Vieira - Integrante / Marcos Bedo - Integrante / Marco Aurelio Pereira Horta - Integrante / Carla Osthoff - Integrante / Victor Ströele de Andrade Menezes - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T & A: 3
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: O vírus da Zika (ZIKV) faz parte de um grupo de doenças emergentes infecciosas que afetam em especial habitantes de países em desenvolvimento, incluindo o Brasil. O ZIKV é o responsável por graves anomalias congênitas em bebês, em especial a microcefalia. Dessa forma, para a populac?a?o desses pa??ses, a descoberta de novas drogas que possam ser usadas como tratamento para o ZIKV e? uma prioridade. Embora o Brasil tenha avanc?ado significativamente na u?ltima de?cada em va?rios campos da cie?ncia, as pesquisas em a?reas multidisciplinares como a bioinforma?tica ainda se encontram em amadurecimento, e estas desempenham um papel fundamental para a descoberta de novas drogas para o tratamento do ZIKV. Diversas pesquisas de sucesso no ramo da bioinforma?tica te?m proposto protocolos in silico (baseado em simulac?o?es computacionais) que utilizam ana?lises filogene?ticas/filogeno?micas e mais recentemente as ana?lises farmacofilogeno?micas. Esses protocolos normalmente envolvem um conjunto de programas que executam simulac?o?es cient??ficas e que sa?o encadeados formando um fluxo coerente de atividades, ao qual denominamos workflow. Entretanto, gerenciar um experimento nesse contexto na?o é ?uma tarefa trivial. Cada execuc?a?o de um workflow para descoberta de novas drogas para o ZIKV pode consumir e produzir um grande volume de dados, o que comumente requer o uso de ambientes de Processamento de Alto Desempenho (PAD), como clusters e supercomputadores, aliado a te?cnicas de paralelismo. Apesar de tais ambientes serem bastante utilizados, nos últimos anos temos visto o crescimento dos Ambientes de Computação em Larga Escala Centrada em Dados (DISC), que se baseiam em clusters de computadores de hardware comum, e seus frameworks associados como o Apache Spark que fornece processamento eficiente em memória. Um dos maiores desafios na gere?ncia de experimentos cient??ficos nesses ambientes DISC reside na distribuic?a?o das execuc?o?es das atividades dos workflows nos recursos de forma eficiente. Ale?m disso, devemos nos preocupar com a gere?ncia de metadados e com a ana?lise dos resultados obtidos, seja por meio de representação visual ou utilizando técnicas de aprendizado de máquina. O objetivo principal deste projeto de pesquisa esta? no desenvolvimento de novas te?cnicas de gere?ncia de experimentos cient??ficos baseados em simulac?a?o com o foco no apoio a? descoberta de novas drogas para o tratamento de ZIKV. Essa gere?ncia engloba a distribuic?a?o das simulac?o?es em ambientes DISC heteroge?neos (que envolvem nuvens de computadores, GPUs e clusters de computadores) e ana?lise dos resultados por meio de algoritmos de aprendizado de ma?quina e lo?gica. Todo o desenvolvimento sera? alicerc?ado em dados e processos reais fornecidos pela Fundação Oswaldo Cruz (FIOCRUZ) e pelo Laborato?rio Nacional de Bioinforma?tica (LabInfo) do Laborato?rio Nacional de Computac?a?o Cient?fica.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (5) / Doutorado: (3) . Integrantes: Aline Marins Paes Carvalho - Integrante / Leonardo Murta - Integrante / Vanessa Braganholo - Integrante / Marta Mattoso - Integrante / Daniel Cardoso Moraes de Oliveira - Coordenador / Isabel Rosseti - Integrante / Bruno Lopes Vieira - Integrante / Kary Ann del Carmen Ocaña Gautherot - Integrante / Yuri Frota - Integrante / Lúcia Maria de Assumpção Drummond - Integrante / Cristina Boeres - Integrante / Marcos Bedo - Integrante / Carla Osthoff - Integrante / Victor Ströele de Andrade Menezes - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
      Membro: Aline Marins Paes Carvalho.
    6. 2019-Atual. ASCEND: apoio a Analise de dadoS CiENtificos em ambientes DISC - Produtividade em Pesquisa (PQ) 2018
      Descrição: During the last decade, the scientific community has seen a considerable increase in the number of scientific experiments based on large-scale computational simulations. Such simulations are characterized by the chaining of programs that execute increasingly complex computational models (dataflows). These dataflows are often implemented through scripts or workflows that consume and produce large amounts of data. Due to this volume, processing commonly requires the use of parallelism and High Performance Computing (HPC) environments. The convergence between HPC and the tasks of processing and analyzing scientific data associated with these dataflows has been largely driven by the use of Data Intensive Scalable Computing (DISC) environments. The convergence between HPC and DISC is a recent topic of interest to the scientific community. While HPC environments focus on the high performance of the simulations, usually using supercomputers, the DISC environments are data oriented and are formed by clusters of commodity machines. Examples of DISC frameworks include Spark. The implementation and execution of dataflows in DISC environments poses a number of challenges that are related to large-scale resource management. Often in order for the simulation to reach the processing capacity required to complete in a timely manner, it is necessary to use a number of heterogeneous resources such as CPUs in a cluster and/or GPGPUs. The use of DISC environments requires new algorithms for data fragmentation and tasks, scheduling, management and analysis of produced data, security, and aggregation of results, as well as evaluation tests. The $ASCEND$ project aims at proposing an approach that can execute, manage, monitor, debug dataflows and analyze the data produced by them.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (5) / Doutorado: (5) . Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador / Vanessa Braganholo - Integrante / Leonardo Murta - Integrante / Isabel Rosseti - Integrante / Marcos Lage - Integrante / Aline Paes - Integrante / Cristina Boeres - Integrante / Alexandre Plastino - Integrante / Ubiratam de Paula Junior - Integrante / Lúcia Maria de Assumpção Drummond - Integrante / Yuri Frota - Integrante / Kary Ocaña - Integrante / Marta Mattoso - Integrante / Bruno Lopes Vieira - Integrante / Marcos Bedo - Integrante / Carla Osthoff - Integrante / Victor Ströele de Andrade Menezes - Integrante.
      Membro: Daniel Cardoso Moraes de Oliveira.
    7. 2017-2019. Associate Teams: SciDISC - Scientific data analysis using Data-Intensive Scalable Computing
      Descrição: This project is an international collaborative project between Brazil and France, funded by the French side. --Inria (France) supports "Associate Teams" to strengthen scientific collaboration between Inria project teams and top-level research teams worldwide. -- Data-intensive science requires the integration of two fairly different paradigms: high-performance computing (HPC) and data-intensive scalable computing (DISC). Spurred by the growing need to analyze big scientific data, the convergence between HPC and DISC has been a recent topic of interest. This project will address the grand challenge of scientific data analysis using DISC (SciDISC), by developing architectures and methods to combine simulation and data analysis. The expected results of the project are: new data analysis methods for SciDISC systems; the integration of these methods as software libraries in popular DISC systems, such as Apache Spark; and extensive validation on real scientific applications, by working with our scientific partners such as INRA and IRD in France and Petrobras and the National Research Institute (INCT) on e-medicine (MACC) in Brazil. https://www.inria.fr/en/associate-team/scidisc. Situação: Concluído; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Alvaro Coutinho - Integrante / Esther Pacitti - Integrante / Reza Akbarinia - Integrante / Fabio Porto - Integrante / Patrick Valduriez - Coordenador / Kary Ocaña - Integrante / Eduardo Ogasawara - Integrante / Marta Mattoso - Integrante / José Camata - Integrante / Dennis Shasha - Integrante / Florent Masseglia - Integrante.
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: This project is an international collaborative project between Brazil and France, funded by the French side. --Inria (France) supports "Associate Teams" to strengthen scientific collaboration between Inria project teams and top-level research teams worldwide. -- Data-intensive science requires the integration of two fairly different paradigms: high-performance computing (HPC) and data-intensive scalable computing (DISC). Spurred by the growing need to analyze big scientific data, the convergence between HPC and DISC has been a recent topic of interest. This project will address the grand challenge of scientific data analysis using DISC (SciDISC), by developing architectures and methods to combine simulation and data analysis. The expected results of the project are: new data analysis methods for SciDISC systems; the integration of these methods as software libraries in popular DISC systems, such as Apache Spark; and extensive validation on real scientific applications, by working with our scientific partners such as INRA and IRD in France and Petrobras and the National Research Institute (INCT) on e-medicine (MACC) in Brazil. https://www.inria.fr/en/associate-team/scidisc.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Eduardo Soares Ogasawara - Integrante / Daniel Cardoso Moraes de Oliveira - Integrante / Marta Lima de Queiros Mattoso - Coordenador / Kary Ocana - Integrante / Fábio Porto - Integrante / Patrick Valduriez - Integrante / Esther Pacitti - Integrante / Alvaro L. G. A. Coutinho - Integrante / Florent Masseglia - Integrante / Dennis Shasha - Integrante / José Camata - Integrante / Ji Liu - Integrante. Financiador(es): Institut National de Recherche en Informatique et en Automatique - Siège - Cooperação.
      Membro: Eduardo Soares Ogasawara.
      Descrição: SciDISC (Scientific data analysis using Data-Intensive Scalable Computing) is an associated team (?équipe associée?), between Zenith and 4 teams in the state of Rio de Janeiro (LNCC, COPPE/UFRJ, UFF and CEFET) since january 2017. SciDISC is headed by Marta Mattoso (COPPE/UFRJ) and Patrick Valduriez (Zenith).. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Doutorado: (8) . Integrantes: Alvaro Luiz Gayoso de Azeredo Coutinho - Integrante / Marta Lima de Queiros Mattoso - Coordenador / Camata, Jose J. - Integrante / SILVA, VÍTOR - Integrante / Renan Francisco de Souza - Integrante. Financiador(es): INRIA - Cooperação.
      Membro: Alvaro Luiz Gayoso de Azeredo Coutinho.
    8. 2017-Atual. Heuristicas para Otimizacao Combinatoria: Aplicacoes e Contribuicoes Algoritmicas
      Descrição: Muitos problemas em computação, logística, planejamento e engenharia, entre outras áreas, podem ser formulados como problemas de otimização combinatória. Metaheurísticas são métodos gerais eficazes para resolver tais problemas. Este projeto dirige-se a desenvolvimentos algorítmicos em metaheurísticas e à aplicação de heurísticas na solução de problemas combinatórios. Também são tratadas questões referentes à avaliação e à comparação de algoritmos.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Fabio Protti - Integrante / José Viterbo - Integrante / Isabel Rosseti - Coordenador / Alexandre Plastino - Integrante / Simone de Lima Martins - Integrante / Celso da Cruz Carneiro Ribeiro - Integrante / Luidi Simonetti - Integrante.
      Membro: Daniel Cardoso Moraes de Oliveira.
    9. 2016-2019. Apoio a Simulacoes Computacionais em Ambientes Hibridos Guiada por Dados de Proveniencia - Produtividade em Pesquisa (PQ) 2016
      Descrição: Nos últimos anos, a comunidade acadêmica tem percebido um aumento na quantidade de simulações computacionais executadas em experimentos científicos. Grandes projetos científicos são desenvolvidos por grupos de pesquisadores em colaboração, produzindo dados e programas em grande quantidade, distribuídos e heterogêneos. Muitos cientistas adotam workflows científicos como abstrações para as etapas computacionais envolvidas no experimento e a troca de dados entre estes. Tais workflows são computacionalmente intensivos e produzem um grande volume de dados, necessitando de ambientes de alto desempenho e técnicas de paralelismo para que terminem em tempo hábil. Existem diversos ambientes de processamento de alto desempenho já consolidados e que podem ser usados para executar os workflows como os clusters e as grades computacionais, e, mais recentemente, o conceito de nuvens de computadores têm ganhado bastante importância no cenário científico. Assim, podemos considerar grandes sistemas computacionais integrados, como o SINAPAD por exemplo, como um ambiente computacional híbrido multi-site que oferece acesso a recursos heterogêneos (máquinas em um cluster ou grade, GPUs, etc.) distribuídos, de forma transparente. A execução de workflows neste tipo de ambiente computacional trás uma série de desafios que estão relacionados com a gerência de recursos em larga escala (tanto de número e tipos de processadores quanto de dados e tarefas das simulações computacionais). Muitas vezes para que a simulação atinja a capacidade de processamento necessária para terminar em tempo hábil, é necessário que se utilize uma série de recursos heterogêneos como CPUs em um cluster e GPUs. O uso desses ambientes híbridos requer novos algoritmos de fragmentação de dados e tarefas das simulações, de escalonamento, de gerência de dados produzidos, de tolerância a falhas e de agregação de resultados, além de testes de avaliação. Além disso, devido à larga escala e heterogeneidade do ambiente, a análise dos dados de proveniência dos experimentos científicos, deve ser considerada e utilizada como base para as soluções propostas. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (10) / Mestrado acadêmico: (3) / Doutorado: (2) . Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador / Vanessa Braganholo - Integrante / Aline Paes - Integrante / Lúcia Maria de Assumpção Drummond - Integrante / Yuri Frota - Integrante / Vítor Silva - Integrante / Kary Ocaña - Integrante / Marta Mattoso - Integrante.
      Membro: Daniel Cardoso Moraes de Oliveira.
    10. 2016-2019. GRADE-HPAD - GeRenciA de Dados ciEntificos em ambientes Hibridos de Processamento de Alto Desempenho - Jovem Cientista do Nosso Estado FAPERJ 2016
      Descrição: Experimentos científicos complexos são capazes de produzir volumes de dados na casa dos Petabytes. Esse volume de dados é produto normalmente de complexas simulações computacionais que fazem parte dos experimentos. Em muitos experimentos são adotados workflows como abstração para representar as etapas computacionais de uma simulação. Muitas dessas etapas dos workflows são datacêntricas, mas também são computacionalmente intensivas, assim necessitando de ambientes de processamento de alto desempenho (PAD) e técnicas de paralelismo para que produzam dados em tempo hábil. Existem diversos ambientes de PAD como os clusters, as grades, e, mais recentemente, as nuvens e as GPGPUs. Entretanto, nos últimos anos, ambientes compostos por recursos heterogêneos têm sido propostos, os chamados ambientes híbridos. Exemplos de tais ambientes são nuvens e clusters que são formados tanto por CPUs quanto por GPGPUs, além de nuvens federadas e multi-sítio. Além da execução do workflow nestes ambientes, devemos nos preocupar com a qualidade dos dados. Muitos dados possuem um nível de incerteza associado, normalmente porque os programas utilizados nas simulações não são determinísticos. A análise desses dados também é um ponto fundamental, porém dados científicos são normalmente multi-relacionados, o que demanda técnicas de aprendizado de máquina mais complexas que as tradicionais. As soluções existentes para gerência dos dados científicos já englobam a execução paralela e a coleta de dados de proveniência em ambientes tradicionais, porém, não oferecem apoio a ambientes híbridos. O uso de ambientes híbridos requer novos algoritmos de fragmentação, de escalonamento, e de gerência e análise de dados produzidos. Além disso, devido à heterogeneidade do ambiente, os dados de proveniência devem ser considerados e utilizados como base para as soluções propostas. Desta forma, este projeto visa desenvolver uma série de soluções para ambientes híbridos para gerência e análise de dados científicos. Situação: Concluído; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
    11. 2016-Atual. UFFeScience: Apoio Computacional a Experimentos de Larga Escala para Desenho de Novas Drogas para Tratamento de Doencas Tropicais Negligenciadas
      Descrição: termo ?Doenças Tropicais Negligenciadas se refere a um grupo de doenças tropicais endêmicas que afetam em especial habitantes da Ásia, África e da América Latina. Algumas dessas DTN são responsáveis por altas taxas de mortalidade nessas regiões. Assim, para a população desses países, a descoberta de novas drogas que possam ser usadas como tratamento para as DTN é uma prioridade. Em especial no cenário brasileiro, e mais especificamente no estado do Rio de Janeiro, diversas DTN atingem parte da população, como por exemplo, a Dengue. Embora o Brasil tenha avançado significativamente na última década em vários campos da ciência, as pesquisas em áreas multidisciplinares como a bioinformática ainda estão em amadurecimento, e estas desempenham um papel fundamental para o desenvolvimento do país e do estado e para a descoberta de novas drogas para o tratamento das DTN. Diversas pesquisas de sucesso no ramo da bioinformática têm proposto protocolos in-silica (baseado em simulações computacionais) que utilizam análises filogenéticas/filogenônicas e mais recentemente as análises farmacofilogenônicas. Esses protocolos normalmente envolvem um conjunto de programas que executam simulações científicas e que são encadeados formando um fluxo coerente de atividades, ao qual denominamos workflow. Em um mesmo experimento de bioinformática para descoberta de novas drogas para DTN é comum que tenhamos mais de um workflow e que este mesmo workflow seja executado diversas vezes, variando-se dados de entrada e parametrização de configuração, a fim de confirmar ou refutar uma determinada hipótese. Entretanto, gerenciar um experimento nesse contexto não é uma tarefa trivial. Cada execução de um workflow pode consumir e produzir um grande volume de dados, o que comumente requer Processamento de Alto Desempenho (PAD) aliada a técnicas de paralelismo para produzir resultados em tempo hábil. A demanda por técnicas de gerência de experimentos em ambientes de PAD vem crescendo a cada ano, ao mesmo tempo em que surgem novos ambientes como as nuvens de computadores (que podem ser multi-site e federadas) e as unidades de processamento gráfico de propósito geral (GPGPUs). Um dos maiores desafios na gerência de experimentos científicos nesses ambientes reside na distribuição das execuções das atividades dos workflows nos recursos de forma eficiente. Essas execuções podem ser distribuídas em mais de um ambiente (cluster local, nuvem e GPGPU) e essa heterogeneidade insere uma complexidade adicional (e grande) no processo. Além disso, devemos nos preocupar com a gerência de metadados e com a análise dos resultados obtidos. Diversas pesquisas na área de mineração de dados e aprendizado de máquina têm sido propostas com foco na análise de grandes volumes de dados. Entretanto, os dados biológicos produzidos por esses experimentos não podem ser representados como tuplas chave-valor, como acontece tradicionalmente em algoritmos de mineração de dados (e.g. K-means). Dados biológicos são normalmente multi-relacionados, o que demanda técnicas de aprendizado de máquina mais complexas como a mineração de dados multi-relacional (MDMR). Uma vez que essas técnicas possam ser aplicadas/adaptadas no contexto de experimentos de bioinformática para descoberta de novas drogas podemos descobrir novos padrões de sequências, funções de genes e interações proteína-proteína que alavanquem investigações na terapia de DTN. O objetivo principal deste projeto de pesquisa está no desenvolvimento de novas técnicas de gerência de experimentos para DTN.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (6) / Doutorado: (2) . Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador / Vanessa Braganholo - Integrante / Isabel Rosseti - Integrante / Aline Paes - Integrante / Yuri Frota - Integrante / Cristina Nader Vasconcelos - Integrante / Christiano de Oliveira Braga - Integrante / Bruno Lopes Vieira - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: Doenças Tropicais Negligenciadas se refere a um grupo de doenças tropicais endêmicas que afetam em especial habitantes da Ásia, África e da América Latina. Algumas dessas DTN são responsáveis por altas taxas de mortalidade nessas regiões. Assim, para a população desses países, a descoberta de novas drogas que possam ser usadas como tratamento para as DTN é uma prioridade. Em especial no cenário brasileiro, e mais especificamente no estado do Rio de Janeiro, diversas DTN atingem parte da população, como por exemplo, a Dengue. Embora o Brasil tenha avançado significativamente na última década em vários campos da ciência, as pesquisas em áreas multidisciplinares como a bioinformática ainda estão em amadurecimento, e estas desempenham um papel fundamental para o desenvolvimento do país e do estado e para a descoberta de novas drogas para o tratamento das DTN. Diversas pesquisas de sucesso no ramo da bioinformática têm proposto protocolos in-silica (baseado em simulações computacionais) que utilizam análises filogenéticas/filogenônicas e mais recentemente as análises farmacofilogenônicas. Esses protocolos normalmente envolvem um conjunto de programas que executam simulações científicas e que são encadeados formando um fluxo coerente de atividades, ao qual denominamos workflow. Em um mesmo experimento de bioinformática para descoberta de novas drogas para DTN é comum que tenhamos mais de um workflow e que este mesmo workflow seja executado diversas vezes, variando-se dados de entrada e parametrização de configuração, a fim de confirmar ou refutar uma determinada hipótese. Entretanto, gerenciar um experimento nesse contexto não é uma tarefa trivial. Cada execução de um workflow pode consumir e produzir um grande volume de dados, o que comumente requer Processamento de Alto Desempenho (PAD) aliada a técnicas de paralelismo para produzir resultados em tempo hábil. A demanda por técnicas de gerência de experimentos em ambientes de PAD vem crescendo a cada ano, ao mesmo tempo em que surgem novos ambientes como as nuvens de computadores (que podem ser multi-site e federadas) e as unidades de processamento gráfico de propósito geral (GPGPUs). Um dos maiores desafios na gerência de experimentos científicos nesses ambientes reside na distribuição das execuções das atividades dos workflows nos recursos de forma eficiente. Essas execuções podem ser distribuídas em mais de um ambiente (cluster local, nuvem e GPGPU) e essa heterogeneidade insere uma complexidade adicional (e grande) no processo. Além disso, devemos nos preocupar com a gerência de metadados e com a análise dos resultados obtidos. Diversas pesquisas na área de mineração de dados e aprendizado de máquina têm sido propostas com foco na análise de grandes volumes de dados. Entretanto, os dados biológicos produzidos por esses experimentos não podem ser representados como tuplas chave-valor, como acontece tradicionalmente em algoritmos de mineração de dados (e.g. K-means). Dados biológicos são normalmente multi-relacionados, o que demanda técnicas de aprendizado de máquina mais complexas como a mineração de dados multi-relacional (MDMR). Uma vez que essas técnicas possam ser aplicadas/adaptadas no contexto de experimentos de bioinformática para descoberta de novas drogas podemos descobrir novos padrões de sequências, funções de genes e interações proteína-proteína que alavanquem investigações na terapia de DTN. O objetivo principal deste projeto de pesquisa está no desenvolvimento de novas técnicas de gerência de experimentos para DTN. Situação: Desativado; Natureza: Pesquisa. Integrantes: Aline Marins Paes Carvalho - Integrante / Vanessa Braganholo - Integrante / Daniel Cardoso Moraes de Oliveira - Coordenador / Cristina Nader Vasconcelos - Integrante / Isabel Rosseti - Integrante / Christiano de Oliveira Braga - Integrante / Bruno Lopes Vieira - Integrante / Yuri Frota - Integrante. Financiador(es): FAPERJ - Auxílio financeiro.
      Membro: Aline Marins Paes Carvalho.
    12. 2016-Atual. BioMiningHPC: Arquitetura baseada em Workflows, Mineracao e Proveniencia de Dados de Experimentos de Bioinformatica para Ambientes HPC no Apoio ao Estudo de Doencas Negligenciadas e Doencas Genomicas Raras em Humanos - APQ1 FAPERJ
      Descrição: Embora o Brasil tenha avançado significativamente nos últimos anos em vários campos das Ciências e tecnologias afins, pesquisas em áreas multidisciplinares como a bioinformática ainda são nascentes, mesmo sendo fundamentais para o desenvolvimento biotecnológico do país. As pesquisas biomédicas/biotecnológicas têm alavancado descobertas científicas devido à exploração da grande quantidade de dados coletada de pesquisas genômicas/proteômicas para a descoberta de padrões de sequências, funções de genes e interações proteína-proteína que alavanquem investigações de biomarcadores e/ou na terapia de doenças. Por outro lado, recentes progressos nas pesquisas na mineração de dados têm levado ao desenvolvimento de numerosos métodos eficientes/escaláveis para mineração, interessantes para os padrões/conhecimento em grandes bancos de dados e.g. métodos de classificação eficiente, análises de valores/resultados atípicos, frequência, métodos de análise de padrões estruturados, ferramentas de análise de dados temporal/espacial, e visualização. O desafio em questão é a melhor maneira de tornar experimentos de mineração de dados biológicos em larga escala em uma metodologia exitosa. Neste caso, o cientista precisa de um grau de abstração para poder atrelar as atividades domínio específicas da bioinformática a aquelas que melhor se adéquam ao algoritmo de mineração e acopla-los em uma arquitetura. Esses experimentos podem ser modelados como workflows e interconectados a Sistemas de Gerenciamento de Workflows Científicos, Sistemas de Gerenciamento de Banco de Dados e Sistemas Web. Desta maneira, workflows podem usufruir das vantagens de paralelismo e distribuição de ambientes de computação de alto desempenho como clusters de supercomputadores e recentemente nuvens. No entanto, a integração/uso desses ambientes apresentam outros muitos desafios relacionados principalmente à gerência de recursos em larga escala i.e. dados, tarefas, simulações computacionais, número de processadores. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Vanessa Braganholo - Integrante / Antônio Tadeu Azevedo Gomes - Integrante / Aline Paes - Integrante / Kary Ocaña - Coordenador / Marta Mattoso - Integrante / Luiz Gadelha - Integrante / Ana Tereza Ribeiro de Vasconcelos - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: Embora o Brasil tenha avançado significativamente nos últimos anos em vários campos das Ciências e tecnologias afins, pesquisas em áreas multidisciplinares como a bioinformática ainda são nascentes, mesmo sendo fundamentais para o desenvolvimento biotecnológico do país. As pesquisas biomédicas/biotecnológicas têm alavancado descobertas científicas devido à exploração da grande quantidade de dados coletada de pesquisas genômicas/proteômicas para a descoberta de padrões de sequências, funções de genes e interações proteína-proteína que alavanquem investigações de biomarcadores e/ou na terapia de doenças. Por outro lado, recentes progressos nas pesquisas na mineração de dados têm levado ao desenvolvimento de numerosos métodos eficientes/escaláveis para mineração, interessantes para os padrões/conhecimento em grandes bancos de dados e.g. métodos de classificação eficiente, análises de valores/resultados atípicos, frequência, métodos de análise de padrões estruturados, ferramentas de análise de dados temporal/espacial, e visualização. O desafio em questão é a melhor maneira de tornar experimentos de mineração de dados biológicos em larga escala em uma metodologia exitosa. Neste caso, o cientista precisa de um grau de abstração para poder atrelar as atividades domínio específicas da bioinformática a aquelas que melhor se adéquam ao algoritmo de mineração e acopla-los em uma arquitetura. Esses experimentos podem ser modelados como workflows e interconectados a Sistemas de Gerenciamento de Workflows Científicos, Sistemas de Gerenciamento de Banco de Dados e Sistemas Web. Desta maneira, workflows podem usufruir das vantagens de paralelismo e distribuição de ambientes de computação de alto desempenho como clusters de supercomputadores e recentemente nuvens. No entanto, a integração/uso desses ambientes apresentam outros muitos desafios relacionados principalmente à gerência de recursos em larga escala i.e. dados, tarefas, simulações computacionais, número de processadores.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Aline Marins Paes Carvalho - Integrante / Vanessa Braganholo - Integrante / Marta Mattoso - Integrante / Daniel Cardoso Moraes de Oliveira - Integrante / Luiz Gadelha - Integrante / Antônio Tadeu Azevedo Gomes - Integrante / Ana Tereza Ribeiro de Vasconcelos - Integrante / Kary Ann del Carmen Ocaña Gautherot - Coordenador.
      Membro: Aline Marins Paes Carvalho.
    13. 2015-2018. PSwmsGpu - Parallel Scientific Workflow Management Systems on GPU - Edital FAPERJ-Sorbonne
      Descrição: Large-scale simulations in computational science are complex to manage. Due to its exploratory nature, several iterations evaluate a large space of parameter combinations spanning many tasks in parallel. Scientific workflow management systems can execute those simulations as a chain of activities (computer programs) and the dataflow between those activities. Workflow systems provide activity and dataflow management, parallel execution and register provenance data. However, there are several open challenges in exploring different models of parallelism during the workflow execution. Among the challenges are: optimizations in parallel execution plan derivation, while taking advantage of different multi-core architectures. For example, general purpose (GP) GPU programming demands coupling highly parallel computing units with classic CPUs to obtain high performance. Heterogeneous systems lead to complex designs combining multiple paradigms and programming languages to manage each hardware architecture. We aim at lowering this complexity in parallel scientific workflow design by using dataflow and programming abstractions to represent the workflow specification. Underlying engines that are aware of the abstractions will have room to optimize the parallel execution plan. We are going to take advantage of two main programming abstractions to leverage workflow parallel execution. One abstraction comes from the Brazilian team, which is a dataflow algebra for the parallel execution of Map/Reduce operations, among others, in scientific workflows. The other abstraction, developed by the French team is SPOC, a library of parallel skeletons that can offer high performance while efficiently easing development, including GPGPU programming. Our goal is to combine the semantics of the dataflow algebraic operations with the power of composition constructs of SPOC skeletons to obtain dynamic generation of parallel execution plans.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Emmanuel Chailloux - Integrante / Marta Mattoso - Coordenador. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
    14. 2014-2017. MUSIC - Gerencia de dados cientificos em uma nuvem multi-site
      Descrição: Grandes projetos científicos em astronomia, biologia, medicina e engenharia produzem grandes volumes de dados, fruto de observação ou coleta instrumentada, ou ainda calculados por simulações numéricas de fenômenos. Na astronomia, por exemplo, projetos como o Large Synoptic Survey Telescope (LSST) estima produzir um mapa 3D do Universo com nível de detalhe e profundidade sem precedentes, o que se traduz em centenas de petabytes de dados em disco. Além do grande volume, dados científicos são imprecisos, devido aos aspectos de calibração dos instrumentos de captura, ou mesmo das incertezas introduzidas nos modelos dos fenômenos observados. Finalmente, grandes projetos científicos são desenvolvidos por grupos de pesquisadores em colaboração, produzindo dados e programas em grande quantidade, distribuídos e heterogêneos. Cientistas adotam workflows científicos como abstrações para as etapas computacionais envolvidas no experimento e a troca de dados entre estes. Além disso, sistemas de gerência de workflows científicos oferecem transparência em relação à complexidade do ambiente computacional, explorando técnicas eficientes de execução, como a execução paralela, e a coleta de dados de proveniência, com suporte à reprodução de experimentos e correções dinâmicas da execução. Finalmente, grandes sistema computacionais integrados, como o SINAPAD coordenado pelo LNCC, são vistos como uma nuvem computacional multi-site que visa a oferecer escalabilidade e acesso a recursos (máquinas, dados e programas) distribuídos, de forma transparente. Desta forma, este projeto pretende desenvolver uma arquitetura em nuvem multi-site para a gerência e análise de grandes volumes de dados científicos. A arquitetura multi-site em nuvem poderá ser utilizada como plataforma compartilhada para experimentos computacionais em diferentes disciplinas da ciência que se valerão de armazenamento, acesso, integração e processamento paralelo de seus dados distribuídos pela arquitetura de forma transparente. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (10) Doutorado: (10) . Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Alvaro Coutinho - Integrante / Esther Pacitti - Integrante / Reza Akbarinia - Integrante / Fabio Porto - Coordenador / Patrick Valduriez - Integrante / Kary Ocaña - Integrante / Eduardo Ogasawara - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
    15. 2014-2014. User-Steering Phylogenetic Workflows in the Cloud - Windows Azure for Research Proposal
      Descrição: This research aims at helping monitoring large-scale parallel execution of bioinformatics phylogenetic analysis workflow in the cloud. These workflows may be deployed as services and its real-time provenance can be queried during the execution so that the scientist can take actions like staging out part of the results such as a phylogenetic tree for visualization. Situação: Concluído; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Kary Ocaña - Integrante / Marta Mattoso - Coordenador.
      Membro: Daniel Cardoso Moraes de Oliveira.
    16. 2013-2017. DocX Processamento de consultas e gerencia de versoes de documentos XML (CNPq, Edital Universal)
      Descrição: O volume de dados XML disponível atualmente vem crescendo cada vez mais. Este fato faz com que a necessidade de mecanismos eficientes de gerência de dados XML seja cada vez maior. Nesse projeto, tratamos de dois problemas diretamente relacionados à gerência de dados XML: processamento de consultas e gerência de versões. Existem vários trabalhos na literatura que lidam com o problema de processar consultas sobre dados XML. Uma abordagem bastante utilizada reside no processamento de consultas em paralelo. Para isso, os dados precisam estar distribuídos em diversos nós de uma rede. Fazer uma fragmentação fixa a priori pode gerar muito desbalanceamento de carga no processamento das consultas. A fragmentação virtual flexibiliza a rigidez da fragmentação física que é fixa. Por ser dinâmica, a fragmentação virtual tem se mostrado um uma boa alternativa para ganho de desempenho no processamento de consultas. No entanto, a abordagem existente, proposta pela proponente e sua equipe, ainda sofre de problemas de balanceamento de carga. Além disso, nem sempre o ambiente disponível dispõe de diversos nós de processamento para executar as consultas. Visando atender também a esse tipo de ambiente, em trabalhos anteriores comparamos o desempenho de processadores de consulta XQuery com máquinas de inferência Prolog. Surpreendentemente, diversas consultas executadas nas máquinas de inferência Prolog obtiveram melhor desempenho do que as consultas equivalentes executadas em processador XQuery nativo. No entanto, este estudo inicial usou traduções ad?hoc que precisam ser sistematizadas e mais bem estudadas. Que tipo de consulta se beneficia do uso de máquina de inferência em seu processamento? Como traduzir consultas XML para consultas Prolog automaticamente? Outra questão primordial que tem recebido pouca atenção na literatura é a gerência de versões de documentos XML. Para que o controle de versões seja efetivo, são necessárias três operações: diff2 (que calcula a diferença entre duas versões consecutivas), diff3 (que calcula a diferença entre duas versões alternativas derivadas da mesma versão base), e merge (que consolida em um único documento as mudanças realizadas em duas versões alternativas). As técnicas existentes exploram a sintaxe e conteúdo do documento para o cálculo do diff2 [Cobena et al. 2002; Wang et al. 2003; Santos and Hara 2007; Sundaram and Madria 2012]. Técnicas para diff3 e merge têm recebido pouca atenção. Essas são questões que este projeto de pesquisa pretende investigar. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (6) Doutorado: (4) . Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Vanessa Braganholo - Coordenador / Leonardo Murta - Integrante / Aline Paes - Integrante / Marta Mattoso - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
    17. 2013-2016. SciCumulus2 - Infraestrutura Computacional para Execucao de Experimentos Cientificos em Nuvens de Computadores, Universal CNPq
      Descrição: Nos últimos anos, a comunidade acadêmica tem percebido um aumento na quantidade de experimentos científicos baseados em simulações computacionais. Muitos destes experimentos são atualmente modelados como workflows científicos e demandam grande capacidade de processamento. Existem diversos ambientes de processamento de alto desempenho já consolidados e disponíveis como clusters e grades computacionais, porém as nuvens de computadores têm ganhado bastante importância devido à sua grande adoção no mundo corporativo. Para que workflows científicos possam se beneficiar de características de nuvens, como a elasticidade e a alta disponibilidade, foi desenvolvido o SciCumulus, uma máquina de execução de workflows, que paraleliza e coordena a execução dos mesmos em ambientes de nuvem. O SciCumulus foi produto da tese de doutorado do proponente e representou um passo muito importante nesse cenário. Com base no sucesso de sua utilização em diversos workflows reais, novas demandas surgiram por parte dos usuários. Além disso, desafios advindos da própria avaliação experimental do SciCumulus levaram à concepção desta nova etapa do SciCumulus, proposta neste projeto de pesquisa. Assim, este projeto tem como objetivo aprofundar a contribuição que sistemas como o SciCumulus podem oferecer em ambientes de nuvens computacionais e propor novas heurísticas de escalonamento, explorar a distribuição de dados do workflow científico e trabalhar na segurança desses dados. Tais desenvolvimentos deverão ser incorporados em uma nova versão dessa infraestrutura denominada SciCumulus2.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (1) . Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador / Vanessa Braganholo - Integrante / Leonardo Murta - Integrante / Aline Paes - Integrante / Kary Ocaña - Integrante / Eduardo Ogasawara - Integrante / Marta Mattoso - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: Nos últimos anos, a comunidade acadêmica tem percebido um aumento na quantidade de experimentos científicos baseados em simulações computacionais. Muitos destes experimentos são atualmente modelados como workflows científicos e demandam grande capacidade de processamento. Existem diversos ambientes de processamento de alto desempenho já consolidados e disponíveis como clusters e grades computacionais, porém as nuvens de computadores têm ganhado bastante importância devido à sua grande adoção no mundo corporativo. Para que workflows científicos possam se beneficiar de características de nuvens, como a elasticidade e a alta disponibilidade, foi desenvolvido o SciCumulus, uma máquina de execução de workflows, que paraleliza e coordena a execução dos mesmos em ambientes de nuvem. O SciCumulus foi produto da tese de doutorado do proponente e representou um passo muito importante nesse cenário. Com base no sucesso de sua utilização em diversos workflows reais, novas demandas surgiram por parte dos usuários. Além disso, desafios advindos da própria avaliação experimental do SciCumulus levaram à concepção desta nova etapa do SciCumulus, proposta neste projeto de pesquisa. Assim, este projeto tem como objetivo aprofundar a contribuição que sistemas como o SciCumulus podem oferecer em ambientes de nuvens computacionais e propor novas heurísticas de escalonamento, explorar a distribuição de dados do workflow científico e trabalhar na segurança desses dados. Tais desenvolvimentos deverão ser incorporados em uma nova versão dessa infraestrutura denominada SciCumulus2.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (1) . Integrantes: Aline Marins Paes Carvalho - Integrante / Daniel de Oliveira - Coordenador / Leonardo Murta - Integrante / Vanessa Braganholo - Integrante / Marta Mattoso - Integrante / Kary Ocaña - Integrante / Eduardo Ogasawara - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
      Membro: Aline Marins Paes Carvalho.
    18. 2013-2015. Ambiente de Cloud Computing para Computacao de Alto Desempenho da Universidade Federal Fluminense, MCTI/ FINEP/ CT-INFRA 01/2013
      Descrição: Grande parte da pesquisa e dos experimentos em larga escala existentes são computacionalmente intensivos e necessitam de muitos recursos computacionais. Em grande parte dos casos, esses recursos são utilizados para executar milhares (e até milhões) de tarefas em ambientes de processamento de alto desempenho (PAD). Nos últimos anos, o paradigma da ?computação em nuvem? (do termo em inglês Cloud Computing) surgiu como alternativa, visando oferecer recursos (inclusive de PAD) de forma elástica (o pesquisador pode aumentar ou diminuir a quantidade e a capacidade de recursos utilizados a qualquer momento) que podem ser instanciados, sob demanda, sem a necessidade dos pesquisadores adquirirem/configurarem uma infraestrutura própria, atingindo assim uma gama maior de usuários. Baseado nesta vantagem proporcionada pelas nuvens de computadores este projeto tem como objetivo principal prover este tipo de infraestrutura virtual baseada no conceito de nuvens para os pesquisadores da UFF. O presente projeto visa disponibilizar para os pesquisadores uma série de serviços que podem ser acessados remotamente e de forma transparente, possibilitando a utilização dos mesmos por vários grupos de pesquisa que atualmente necessitam de uma série de recursos de PAD e armazenamento para executar suas pesquisas. O Instituto de Computação da UFF já conta com um expressivo número de pesquisadores atuando na área de processamento paralelo e em suas aplicações, sendo esta uma das principais e mais ativas linhas de sua pós-graduação. Ressalta-se que novas parcerias de pesquisa possivelmente surgirão a partir da operacionalização deste ambiente de nuvem. Além disso, intensificará tanto a colaboração com outras unidades da UFF, tais como os Institutos de Química, e Física que desenvolvem aplicações que exigem uso intensivo de recursos computacionais.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Fabio Protti - Coordenador / Eugene Francis Vinod Rebello - Integrante / Esteban Clua - Integrante. Financiador(es): Financiadora de Estudos e Projetos - Auxílio financeiro.
      Membro: Daniel Cardoso Moraes de Oliveira.
    19. 2013-2014. Gerencia de Experimentos Cientificos Datacentricos em Nuvens de Computadores, APQ1 FAPERJ
      Descrição: Técnicas de distribuição de atividades e paralelismo de dados em ambientes distribuídos vêm sendo objeto de pesquisas recentes, obtendo resultados significativos no aumento de desempenho de aplicações que lidam com grandes volumes de dados. Estas aplicações incluem experimentos científicos baseados em simulação. Seu uso vem crescendo rapidamente nos últimos anos, o que fez com que diversos cientistas começassem a modelar seus experimentos como workflows científicos. Entretanto, a demanda por técnicas de gerência de dados distribuídos vem crescendo, ao mesmo tempo em que surgem novos cenários de processamento distribuído e paralelo como as nuvens de computadores. Um dos maiores desafios na gerência de experimentos científicos em nuvens de computadores reside na exploração das características da nuvem como elasticidade. Além disso, devemos nos preocupar com a gerência de metadados e a gerência das aplicações (programas) e na composição dessas aplicações. O objetivo principal deste projeto de pesquisa está na geração de novas técnicas de gerência da execução de experimentos científicos em nuvens de computadores. Dentre as novas técnicas de gerência de recursos distribuídos, daremos ênfase à eficiência em: (i) captura e consultas a bases de dados de proveniência distribuídas e (ii) gerência e execução de workflows científicos. Todo o desenvolvimento será guiado pelos aspectos da organização e gerência de dados científicos em experimentos científicos, utilizando como estudo de caso workflows da área de aprendizado de máquina relacional para o estudo de redes sociais. Este experimento necessita realizar uma análise exploratória e se apresenta como um experimento em larga escala que depende de técnicas especializadas no que tange à sua execução paralela e a gerência dos dados.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (1) . Integrantes: Daniel Cardoso Moraes de Oliveira - Coordenador / Vanessa Braganholo - Integrante / Leonardo Murta - Integrante / Aline Paes - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro. Número de produções C, T & A: 2
      Membro: Daniel Cardoso Moraes de Oliveira.
      Descrição: Técnicas de distribuição de atividades e paralelismo de dados em ambientes distribuídos vêm sendo objeto de pesquisas recentes, obtendo resultados significativos no aumento de desempenho de aplicações que lidam com grandes volumes de dados. Estas aplicações incluem experimentos científicos baseados em simulação. Seu uso vem crescendo rapidamente nos últimos anos, o que fez com que diversos cientistas começassem a modelar seus experimentos como workflows científicos. Entretanto, a demanda por técnicas de gerência de dados distribuídos vem crescendo, ao mesmo tempo em que surgem novos cenários de processamento distribuído e paralelo como as nuvens de computadores. Um dos maiores desafios na gerência de experimentos científicos em nuvens de computadores reside na exploração das características da nuvem como elasticidade. Além disso, devemos nos preocupar com a gerência de metadados e a gerência das aplicações (programas) e na composição dessas aplicações. O objetivo principal deste projeto de pesquisa está na geração de novas técnicas de gerência da execução de experimentos científicos em nuvens de computadores. Dentre as novas técnicas de gerência de recursos distribuídos, daremos ênfase à eficiência em: (i) captura e consultas a bases de dados de proveniência distribuídas e (ii) gerência e execução de workflows científicos. Todo o desenvolvimento será guiado pelos aspectos da organização e gerência de dados científicos em experimentos científicos, utilizando como estudo de caso workflows da área de aprendizado de máquina relacional para o estudo de redes sociais. Este experimento necessita realizar uma análise exploratória e se apresenta como um experimento em larga escala que depende de técnicas especializadas no que tange à sua execução paralela e a gerência dos dados.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (1) . Integrantes: Aline Marins Paes Carvalho - Integrante / Daniel de Oliveira - Coordenador / Leonardo Murta - Integrante / Vanessa Braganholo - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
      Membro: Aline Marins Paes Carvalho.
    20. 2012-2015. Gere?ncia de experimentos guiada por provenie?ncia, Edital Gdes Desafios R$ 227.292,00
      Descrição: O contexto do projeto esta? explicitamente identificado do documento "Grandes Desafios" da SBC (2006), no desafio 2 onde e? dito que : ?O objetivo deste desafio e? criar, avaliar, modificar, compor, gerenciar e explorar modelos computacionais para todos esses domínios e aplicações.? Abordamos esse desafio no projeto GExp (proc. 551013/2007-9), dentro do edital Edital MCT/CNPq/CT-INFO no 07/2007 - PDI-TI. A todas essas ac?o?es que evolvem os modelos computacionais dos domínios e aplicações do desafio estamos chamando de "ciclo de vida do experimento científico". Os resultados positivos, nos levaram a propor uma continuidade ao apoio a? gere?ncia dos experimentos científicos em larga escala. No projeto GExp desenvolvemos processos, te?cnicas, algoritmos e software de apoio a?s fases de composição, execução e análise. Porém, devido a? complexidade do desafio 2, essas soluções, embora concretas e promissoras, ainda esta?o longe de resolver o desafio previsto para essa de?cada. Neste novo projeto damos continuidade ao apoio já desenvolvido e reforçamos a e?nfase a? representação e gere?ncia das informações relativas a?s três fases do ciclo de vida do experimento. A proveniência pode ser vista como um dos principais auxílios conceituais para criar, modificar, compor e gerenciar os modelos computacionais do Desafio 2 dos ?Grandes Desafios? da SBC. Essa gere?ncia de proveniência envolve varios desafios, em particular a representação da proveniência nas diversas fases do ciclo de vida e seu correspondente relacionamento. Uma das dificuldades esta? na associação dos dados de proveniência do experimento conceitual com os dados de proveniência do experimento executado. Outro desafio esta? relacionado a representação da proveniência de recursos distribui?dos envolvendo o uso de ambientes de alto desempenho como grandes clusteres e nuvens computacionais. Situação: Desativado; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Vanessa Braganholo - Integrante / Guilherme Horta Travassos - Integrante / Alexandre A B Lima - Integrante / Marta Mattoso - Coordenador.
      Membro: Daniel Cardoso Moraes de Oliveira.
    21. 2012-2013. Apoio computacional ao desenvolvimento cientifico em larga escala, Universal 14/2011 - R$ 144.000,00
      Descrição: A motivação principal desse projeto está no apoio computacional ao desenvolvimento de científico em larga escala. Mais especificamente visamos a enfrentar os desafios na gerência dos recursos distribuídos inerentes ao desenvolvimento de ciência hoje em áreas como bioinformática e de engenharia do petróleo. Trabalhos existentes tendem a tratar os dados separadamente do encadeamento dos processos científicos, ou ainda sem dar atenção ao processamento paralelo. Ao longo da experimentação, os cientistas necessitam desempenhar diversas atividades, e algumas delas estão relacionadas ao encadeamento de programas usados durante as simulações que demandam alto poder computacional. Cada execução de programa pode produzir uma coleção de dados com determinada sintaxe e semântica. Esta coleção de dados pode ser usada como entrada para o próximo programa a ser executado no fluxo. Consideramos que os dados de proveniência podem ser a chave para o apoio ao ciclo de vida do experimento científico. Mattoso et al. (2010) definem o ciclo de um experimento científico como sendo formado por três fases: composição, execução e análise. A composição é a fase que trata da definição, edição e manipulação dos workflows. Estes workflows são submetidos à execução para, posteriormente, terem os resultados das suas diferentes execuções analisados a partir de seus dados de proveniência (Freire et al. 2008). O tratamento dado à proveniência de experimentos científicos é parcialmente obtido por Sistemas de Gerência de Workflows Científicos (SGWfC). A gerência da proveniência é feita atrelada a um workflow específico e sem considerar os recursos distribuídos durante a execução paralela do experimento. Assim, gerenciar os dados de proveniência ao longo do ciclo de vida, envolvendo aspectos de execução distribuída de vários workflows associados ao experimento ainda é um problema longe de ser resolvido. Situação: Concluído; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Marta Mattoso - Coordenador.
      Membro: Daniel Cardoso Moraes de Oliveira.
    22. 2010-2011. CiclExp - Apoio ao Ciclo de vida de Experimentos cientificos, Universal, R$ 122.000,00
      Descrição: ara que experimentos científicos em larga escala possam ser gerenciados, é ne-cessário que um conjunto de funcionalidades esteja presente. Dentre estas, estão o apoio à concepção dos workflows científicos e sua posterior instanciação num SGWfC (Sistema de Gerência de Workflows Científicos), a reutilização de workflows previamente concebidos por outros cientistas, o controle sobre a evolução das diferentes versões dos workflows e a coleta de informações que permitam identificar a proveniência dos dados gerados pela execução dos workflows científicos. Em particular é muito importante que a exploração visual de dados resultantes de workflows esteja associada a dados de proveniência do workflow. É fundamental que essas funcionalidades estejam atreladas ao experimento científico que está sendo conduzido por uma equipe de cientistas. Situação: Concluído; Natureza: Pesquisa. Integrantes: Daniel Cardoso Moraes de Oliveira - Integrante / Vanessa Braganholo - Integrante / Claudia Werner - Integrante / Leonardo Murta - Integrante / Marta Mattoso - Coordenador.
      Membro: Daniel Cardoso Moraes de Oliveira.

Prêmios e títulos

  • Total de prêmios e títulos (39)
    1. Best Reviewer of the Dataset Showcase Workshop 2021, Comissão Especial de Banco de Dados.. 2021.
      Membro: Daniel Cardoso Moraes de Oliveira.
    2. Melhor Demonstração do 36o Simpósio Brasileiro de Banco de Dados com o artigo "Captura Automática de Dados de Proveniência de Experimentos de Aprendizado de Máquina com Keras-Prov", Comissão Especial de Banco de Dados.. 2021.
      Membro: Daniel Cardoso Moraes de Oliveira.
    3. Prêmio de Melhor Avaliador (Top 10) do XXXVI Simpósio Brasileiro de Banco de Dados, Sociedade Brasileira de Computação., Comissão Especial de Banco de Dados.. 2021.
      Membro: Daniel Cardoso Moraes de Oliveira.
    4. Menção Honrosa pelo artigo "HELIX:A data-driven characterization of Brazilian land snails" no Simpósio Brasileiro de Banco de Dados 2021, Comissão Especial de Banco de Dados.. 2021.
      Membro: Daniel Cardoso Moraes de Oliveira.
    5. Gabriela & Roland Wagner Best Paper Award - DEXA 2020: International Conference on Database and Expert Systems Applications - Artigo "Distributed Caching of Scientific Workflows in Multisite Cloud", DEXA Conferences & Workshops 2020.. 2020.
      Membro: Daniel Cardoso Moraes de Oliveira.
    6. Melhor Artigo Curto - XXXV Simpósio Brasileiro de Banco de Dados - Artigo "Criteria for choosing the number of dimensions in a principal component analysis: An empirical assessment", Comissão Especial de Banco de Dados - Sociedade Brasileira de Computação.. 2020.
      Membro: Daniel Cardoso Moraes de Oliveira.
    7. Melhor artigo da trilha de Pós-Graduação da VI Escola Regional de Alto Desempenho do Rio de Janeiro - Artigo "Apoio à Utilização de Análise de Dados em Aplicações CSE por meio de Contêineres", Sociedade Brasileira de Computação.. 2020.
      Membro: Daniel Cardoso Moraes de Oliveira.
    8. Melhor Dissertação de Mestrado defendida em 2018 - Orientação do aluno Thaylon Guedes Santos - "Análise e Captura de Proveniência no Apache Spark", Programa de Pós-Graduação em Computação - Universidade Federal Fluminense.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    9. Melhor Tese de Doutorado defendida em 2018 - Orientação do aluno Vitor Silva Sousa - "Ana?lise de Dados Cienti?ficos sobre Mu?ltiplas Fontes de Dados ao longo da Execuc?a?o de Simulac?o?es Comp.", Programa de Engenharia de Sistemas e Computação - COPPE/UFRJ.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    10. Finalist paper in TCCLS Best Paper Award pelo artigo "A Two-Phase Learning Approach for the Segmentation of Dermatological Wound" no IEEE CBMS International Symposium on Computer-Based Medical Systems, IEEE Technical Commitee on Computational Life Sciences.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    11. Jovem Cientista do Nosso Estado, FAPERJ, FAPERJ.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    12. Melhor Tese de Doutorado - Simpósio Brasileiro de Banco de Dados - Orientação de Vítor Silva Sousa com a tese intitulada "Runtime Dataflow Analysis in Scientific Applications", Comissão Especial de Banco de Dados.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    13. Melhor Demonstração do 34o Simpósio Brasileiro de Banco de Dados com o artigo "J-EDA: A diversified similarity workbench for content-based image retrieval", Comissão Especial de Banco de Dados - Sociedade Brasileira de Computação.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    14. Menção Honrosa pelo artigo "Análise Integrada de Grafos de Proveniência Heterogêneos por meio de uma Abordagem PolyStore" no Simpósio Brasileiro de Banco de Dados 2019, Comissão Especial de Banco de Dados.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    15. Menção Honrosa no VIII Prêmio de Excelência em Docência, Universidade Federal Fluminense.. 2019.
      Membro: Daniel Cardoso Moraes de Oliveira.
    16. Professor Homenageado na Turma 2017.2 de Sistemas de Informação da UFF, Universidade Federal Fluminense.. 2018.
      Membro: Daniel Cardoso Moraes de Oliveira.
    17. Patrono da Turma 2017.2 de Sistemas de Informação da UFF, Universidade Federal Fluminense.. 2018.
      Membro: Daniel Cardoso Moraes de Oliveira.
    18. Melhor Demonstração do 33o Simpósio Brasileiro de Banco de Dados com o artigo "VP-Viewer: keeping Track of Your Query from a Vantage Point", Sociedade Brasileira de Computação.. 2018.
      Membro: Daniel Cardoso Moraes de Oliveira.
    19. Menção Honrosa pelo artigo "Análise Online de Dados de Proveniência e de Domínio de Aplicações Spark com SAMbA", no Simpósio Brasileiro de Banco de Dados, Sociedade Brasileira de Computação.. 2018.
      Membro: Daniel Cardoso Moraes de Oliveira.
    20. Professor Homenageado na Turma 2016.2 de Sistemas de Informação da UFF, Universidade Federal Fluminense.. 2017.
      Membro: Daniel Cardoso Moraes de Oliveira.
    21. Menção Honrosa pelo artigo "Análise de Dados Científicos: uma Análise Comparativa de Dados de Simulações Computacionais" no XXXII Simpósio Brasileiro de Banco de Dados, Sociedade Brasileira de Computação.. 2017.
      Membro: Daniel Cardoso Moraes de Oliveira.
    22. Prêmio de Melhor Avaliador do XXXII Simpósio Brasileiro de Banco de Dados, Sociedade Brasileira de Computação.. 2017.
      Membro: Daniel Cardoso Moraes de Oliveira.
    23. Best Paper Award - 6th International Provenance and Annotation Workshop (IPAW) in conjunction with The 2016 Provenance Week, Springer.. 2016.
      Membro: Daniel Cardoso Moraes de Oliveira.
    24. Melhor artigo do X Brazilian e-Science Workshop (BreSci) para o trabalho intitulado "Verificação da Reprodução de Workflows Científicos por meio de Algoritmos de Detecção de Plágio", Sociedade Brasileira de Computação.. 2016.
      Membro: Daniel Cardoso Moraes de Oliveira.
    25. Paraninfo da turma 2015.2 do curso de Bacharelado em Ciência da Computação, Universidade Federal Fluminense.. 2016.
      Membro: Daniel Cardoso Moraes de Oliveira.
    26. Jovem Cientista do Nosso Estado, FAPERJ.. 2016.
      Membro: Daniel Cardoso Moraes de Oliveira.
    27. Paraninfo da turma 2016.1 do curso de Bacharelado em Ciência da Computação, Universidade Federal Fluminense.. 2016.
      Membro: Daniel Cardoso Moraes de Oliveira.
    28. Professor Homenageado na Turma 2014/2 de Ciência da Computação da UFF, Universidade Federal Fluminense.. 2015.
      Membro: Daniel Cardoso Moraes de Oliveira.
    29. 2o melhor artigo do XIV Workshop em Desempenho de Sistemas Computacionais e de Comunicação, Sociedade Brasileira de Computação.. 2015.
      Membro: Daniel Cardoso Moraes de Oliveira.
    30. Melhor artigo do Latin America High Performance Computing Conference (CARLA 2015), Sociedade Brasileira de Computação.. 2015.
      Membro: Daniel Cardoso Moraes de Oliveira.
    31. Menção Honrosa pelo artigo "Uma Abordagem para Publicação de Dados de Proveniência de Workflows Científicos na Web Semântica" no XXX Simpósio Brasileiro de Banco de Dados, Sociedade Brasileira de Computação.. 2015.
      Membro: Daniel Cardoso Moraes de Oliveira.
    32. Professor homenageado da turma 6AINFO 2013.2 do curso técnico em informática, Centro Federal de Educação Tecnológica Celso Suckow da Fonseca.. 2014.
      Membro: Daniel Cardoso Moraes de Oliveira.
    33. Tese de Doutorado indicada a premiação pelo PESC/COPPE/UFRJ - Concurso de Teses da CAPES, PESC/COPPE.. 2013.
      Membro: Daniel Cardoso Moraes de Oliveira.
    34. Best Paper Award - 2nd International Workshop on Cloud Computing and Scientific Applications (CCSA) In conjunction with The 12th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing, Dell Inc... 2012.
      Membro: Daniel Cardoso Moraes de Oliveira.
    35. Aprovação em 1o Lugar no Concurso público para o cargo de Tecnologista Pleno 2, Laboratório Nacional de Computação Científica - LNCC.. 2012.
      Membro: Daniel Cardoso Moraes de Oliveira.
    36. Aprovação em 1o Lugar no Concurso público para o cargo de Professor Adjunto, Universidade Federal Fluminense (UFF).. 2012.
      Membro: Daniel Cardoso Moraes de Oliveira.
    37. Menção honrosa na XXXIV Jornada Giulio Massarani de Iniciação Científica - Orientação do aluno Pedro Henrique Cruz Caminha, Universidade Federal do Rio de Janeiro.. 2012.
      Membro: Daniel Cardoso Moraes de Oliveira.
    38. Aprovação em concurso para professor temporário - Edital 2011/003, Centro Federal de Educação Tecnológica Celso Suckow da Fonseca (CEFET/RJ).. 2011.
      Membro: Daniel Cardoso Moraes de Oliveira.
    39. Aprovação em concurso para professor - Edital 2010/001, Centro Federal de Educação Tecnológica Celso Suckow da Fonseca (CEFET-RJ).. 2010.
      Membro: Daniel Cardoso Moraes de Oliveira.

Participação em eventos

  • Total de participação em eventos (0)

    Organização de eventos

    • Total de organização de eventos (9)
      1. OLIVEIRA, D.. Chair da Comissão Especial em Biologia Computacional da Sociedade Brasileira de Computação. 2021. (Outro).. . 0.
      2. OLIVEIRA, D.; JEANNOT, E. ; TATEBE, O. ; OLSCHANOWKSY, C.. Publicity Co-Chair IEEE Cluster 2021. 2021. Congresso
      3. OLIVEIRA, D.; PORTO, F.. Co-Chair do TPC do Simpósio Brasileiro de Banco de Dados (SBBD). 2020. Congresso
      4. OLIVEIRA, D.. General Chair do do Simpósio Brasileiro de Bioinformática (BSB - Brazilian Symposium on Bioinformatics). 2020. (Congresso).. . 0.
      5. OLIVEIRA, D.; OGASAWARA, E.. Chair do XIII Brazilian eScience Workshop. 2019. Congresso
      6. KOWADA, L. A. B. ; OLIVEIRA, D.. Co-Chair do Simpósio Brasileiro de Bioinformática (BSB - Brazilian Symposium on Bioinformatics). 2018. Congresso
      7. OLIVEIRA, D.. Chair da Sessão de Demos do XXXII Simpósio Brasileiro de Banco de Dados. 2017. (Congresso).. . 0.
      8. OLIVEIRA, D.; MEIRA JR., W.. Co-Chair do WPerformance - XV Workshop em Desempenho de Sistemas Computacionais e de Comunicação. 2016. Congresso
      9. OLIVEIRA, D.; GOMES, A. T. A.. Co-Chair do BreSci - VIII Brazilian e-Science workshop. 2014. Congresso

    Lista de colaborações

    • Colaborações endôgenas (8)
      • Daniel Cardoso Moraes de Oliveira ⇔ Eduardo Soares Ogasawara (50.0)
        1. MARINHO, ANDERSON ; DE OLIVEIRA, DANIEL ; OGASAWARA, EDUARDO ; SILVA, VITOR ; OCAÑA, KARY ; MURTA, LEONARDO ; BRAGANHOLO, VANESSA ; MATTOSO, MARTA. Deriving scientific workflows from algebraic experiment lines: A practical approach. Future Generation Computer Systems. v. 68, p. 111-127, issn: 0167-739X, 2017.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        2. OGASAWARA, E.; OLIVEIRA, D. ; PASCHOAL JR, F. ; CASTANEDA, R. ; AMORIM, M. ; MAURO, R. C. ; SOARES, J. ; QUADROS, J. R. ; BEZERRA, E.. A Forecasting Method for Fertilizers Consumption in Brazil. International Journal of Agricultural and Environmental Information Systems. v. 4, p. 23-36, issn: 1947-3192, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        3. OLIVEIRA, D. ; OCANA, K. ; Ogasawara, Eduardo ; DIAS, J. ; GONÇALVES, J. ; BAIÃO, F. ; MATTOSO, M. L. Q.. Performance evaluation of parallel strategies in public clouds: A study with phylogenomic workflows. Future Generation Computer Systems. v. 29, p. 1816-1825, issn: 0167-739X, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        4. OCANA, K. ; OLIVEIRA, D. ; DIAS, J. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. Designing a parallel cloud based comparative genomics workflow to improve phylogenetic analyses. Future Generation Computer Systems. v. 30, p. 2205-2219, issn: 0167-739X, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        5. GONÇALVES, J. ; DE OLIVEIRA, DANIEL ; OLIVEIRA, D. ; OCANA, K. ; OGASAWARA, E. ; DIAS, J. ; MATTOSO, M. L. Q.. Performance Analysis of Data Filtering in Scientific Workflows. Journal of Information and Data Management - JIDM. v. 4, p. 17-26, issn: 2178-7107, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        6. QUADROS, J. ; CASTANEDA, R. ; AMORIM, M. ; HERZOG, G. ; CARNEIRO, L. ; MENEZES, K. ; PINHEIRO, M. ; OLIVEIRA, D. ; OGASAWARA, E.. Construção de ambiente para desenvolvimento de jogos educacionais baseados em interface de gestos. Revista Brasileira de Computação Aplicada. v. 5, p. 110-119, issn: 2176-6649, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        7. Ogasawara, Eduardo; DIAS, JONAS ; SILVA, VITOR ; CHIRIGATI, FERNANDO ; DE OLIVEIRA, DANIEL ; PORTO, FABIO ; VALDURIEZ, PATRICK ; MATTOSO, MARTA. Chiron: a parallel engine for algebraic scientific workflows. Concurrency and Computation. v. 25, p. 2327-2341, issn: 1532-0626, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        8. GUERRA, G. ; ROCHINHA, F. A. ; ELIAS, R. ; Oliveira, D. ; OGASAWARA, E. ; DIAS, J. ; Mattoso, Marta ; MATTOSO, M. L. Q. ; COUTINHO, A. L. G. A., Alvaro L.G.A. Coutinho. UNCERTAINTY QUANTIFICATION IN COMPUTATIONAL PREDICTIVE MODELS FOR FLUID DYNAMICS USING A WORKFLOW MANAGEMENT ENGINE. International Journal for Uncertainty Quantifications (Print). v. 2(1), p. 53-71, issn: 2152-5080, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        9. OLIVEIRA, D. ; OGASAWARA, E. ; OCANA, K. ; BAIÃO, FERNANDA ; MATTOSO, M. L. Q.. An Adaptive Parallel Execution Strategy for Cloud-based Scientific Workflows. CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE. v. 24, p. 1531-1550, issn: 1532-0626, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        10. OLIVEIRA, D. ; OGASAWARA, E. ; DIAS, J. ; BAIÃO, FERNANDA ; MATTOSO, M. L. Q.. Ontology-based Semi-automatic Workflow Composition. Journal of Information and Data Management. Journal of Information and Data Management - JIDM. v. 3, p. 61-72, issn: 2178-7107, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        11. SOUSA, V. ; CHIRIGATI, F. ; MAIA, K. ; OGASAWARA, E. ; OLIVEIRA, D. ; BRAGANHOLO, V. ; MURTA, L. ; MATTOSO, M. L. Q.. Similarity-based Workflow Clustering. Journal of Computational Interdisciplinary Sciences. v. 2, p. 23-35, issn: 1983-8409, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        12. COUTINHO, F. ; OGASAWARA, E. ; OLIVEIRA, D. ; BRAGANHOLO, V. ; LIMA, A. A. ; DAVILLA, A. M. R. ; MATTOSO, M. L. Q.. Many Task Computing for Orthologous Genes Identification in Protozoan Genomes Using Hydra. Concurrency and Computation. v. 23, p. 2326-2337, issn: 1532-0626, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        13. Ogasawara, Eduardo; DIAS, JONAS ; DE OLIVEIRA, DANIEL ; PORTO, FÁBIO ; VALDURIEZ, PATRICK ; MATTOSO, MARTA. An Algebraic Approach for Data-Centric Scientific Workflows. Proceedings of the VLDB Endowment. v. 4, p. 1328-13369, issn: 2150-8097, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        14. Mattoso, Marta ; Werner, Claudia ; TRAVASSOS, G. H. ; Braganholo, Vanessa ; Ogasawara, Eduardo ; Oliveira, Daniel De ; Cruz, Sergio Manuel Serra Da ; Martinho, Wallace ; Murta, Leonardo. Towards supporting the life cycle of large scale scientific experiments. International Journal of Business Process Integration and Management (Print). v. 5, p. 79-92, issn: 1741-8763, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        15. VALDURIEZ, PATRICK ; MATTOSO, MARTA ; AKBARINIA, R. ; BORGES, H. ; CAMATA, J. ; COUTINHO, ALVARO L. G. A. ; GASPAR, D. ; LEMUS, N. ; LIU, J. ; LUSTOSA, H. ; MASSEGLIA, F. ; SILVA, F. N. ; SILVA, VÍTOR ; SOUZA, R. ; OCANA, KARY ; OGASAWARA, E. ; OLIVEIRA, D. ; PACITTI, ESTHER ; PORTO, F. ; SHASHA, D.. Scientific Data Analysis Using Data-Intensive Scalable Computing: the SciDISC Project. Em: 1st LADaS - Latin American Data Science Workshop, p. 1-8, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        16. MATTOSO, M. L. Q. ; DIAS, J. ; COSTA, FLAVIO ; OLIVEIRA, D. ; OGASAWARA, E.. Experiences in using provenance to optimize the parallel execution of scientific workflows steered by users. Em: Workshop of Provenance Analytics, 2014.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        17. COSTA, FLAVIO ; SILVA, VÍTOR ; DE OLIVEIRA, DANIEL ; OCAÑA, KARY ; Ogasawara, Eduardo ; DIAS, JONAS ; MATTOSO, MARTA. Capturing and querying workflow runtime provenance with PROV. Em: the Joint EDBT/ICDT 2013 Workshops, p. 282-289, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        18. SOUSA, V. ; DIAS, J. ; OLIVEIRA, D. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. Uma Arquitetura P2P de Distribuição de Atividades para Execução Paralela de Workflows Científicos. Em: VII Brazilian e-Science Workshop, p. 1795-1802, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        19. ARAÚJO, IGOR ; DIAS, J. ; OLIVEIRA, D. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. DynAdapt: Alterações na Definição de Atividades de Workflows Científicos em Tempo de Execução. Em: VII Brazilian e-Science Workshop, p. 1831-1838, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        20. MATTOSO, MARTA ; OCAÑA, KARY ; HORTA, FELIPE ; DIAS, JONAS ; Ogasawara, Eduardo ; SILVA, VITOR ; DE OLIVEIRA, DANIEL ; COSTA, FLAVIO ; ARAÚJO, IGOR. User-steering of HPC workflows. Em: the 2nd ACM SIGMOD Workshop, p. 1-10, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        21. QUADROS, J. R. ; OLIVEIRA, D. ; QUEIROZ, A. ; OGASAWARA, E.. Towards a Reference Model for ODL: a Case Study in the Tourism Undergraduate Course. Em: International Conference on Interactive Computer aided Blended Learning (ICBL 2013), p. 151-158, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        22. DIAS, JONAS ; Ogasawara, Eduardo ; DE OLIVEIRA, DANIEL ; PORTO, FABIO ; VALDURIEZ, PATRICK ; MATTOSO, MARTA. Algebraic dataflows for big data analysis. Em: 2013 IEEE International Conference on Big Data, p. 150-155, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        23. ARAUJO, I. ; DIAS, J. ; OLIVEIRA, DANIEL DE ; OGASAWARA, E. ; OCAÑA, K. ; MATTOSO, M.. Runtime Dynamic Structural Changes of Scientific Workflows in Clouds. Em: 2013 IEEE/ACM 6th International Conference on Utility and Cloud Computing (UCC), p. 417-422, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        24. DE OLIVEIRA, DANIEL ; VIANA, VITOR ; Ogasawara, Eduardo ; OCANA, KARY ; MATTOSO, MARTA. Dimensioning the virtual cluster for parallel scientific workflows in clouds. Em: the 4th ACM workshop, p. 5-12, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        25. CHIRIGATI, F. ; SOUSA, V. ; Ogasawara, Eduardo ; OLIVEIRA, D. ; DIAS, J. ; PORTO, F. ; VALDURIEZ, P. ; MATTOSO, M. L. Q.. Evaluating Parameter Sweep Workflows in High Performance Computing. Em: The 1st international workshop on Scalable Workflow Enactment Engines and Technologies (SWEET'12), p. 1, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        26. OLIVEIRA, D. ; OCANA, K. ; OGASAWARA, E. ; DIAS, J. ; GONÇALVES, J. ; MATTOSO, M. L. Q.. Cloud-based Phylogenomic Inference of Evolutionary Relationships: A Performance Study. Em: 2nd International Workshop on Cloud Computing and Scientific Applications (CCSA), 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        27. GONÇALVES, J. ; OLIVEIRA, D. ; OGASAWARA, E. ; OCANA, K. ; MATTOSO, M. L. Q.. Using Domain-Specific Data to Enhance Scientific Workflow Steering Queries. Em: 4th International Provenance and Annotation Workshop, v. 7525, p. 152-167, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        28. COSTA, FLAVIO ; OLIVEIRA, D. ; OCANA, K. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. Enabling Re-Executions of Parallel Scientific Workflows Using Runtime Provenance Data. Em: 4th International Provenance and Annotation Workshop, v. 7525, p. 229-232, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        29. OCANA, K. ; OLIVEIRA, D. ; HORTA, FELIPE ; DIAS, J. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. Exploring Molecular Evolution Reconstruction Using a Parallel Cloud-based Scientific Workflow. Em: Brazilian Symposium on Bioinformatics 2012, v. 7409, p. 179-191, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        30. GONÇALVES, J. ; OLIVEIRA, D. ; OCANA, K. ; Ogasawara, Eduardo ; DIAS, J. ; MATTOSO, M. L. Q.. Using Provenance Analyzers to Improve the Performance of Scientific Workflows in Cloud Environments. Em: 27º Simpósio Brasileiro de Bancos de Dados (SBBD 2012), p. 1-8, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        31. COSTA, FLAVIO ; OLIVEIRA, DANIEL DE ; OCANA, KARY ; Ogasawara, Eduardo ; DIAS, JONAS ; MATTOSO, MARTA. Handling Failures in Parallel Scientific Workflows Using Clouds. Em: The 7th Workshop on Workflows in Support of Large-Scale Science, p. 129, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        32. OCANA, KARY A. C. S. ; DE OLIVEIRA, DANIEL ; DIAS, JONAS ; Ogasawara, Eduardo ; MATTOSO, MARTA. Discovering drug targets for neglected diseases using a pharmacophylogenomic cloud workflow. Em: 2012 IEEE 8th International Conference on EScience (eScience), p. 1, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        33. GUERRA, GABRIEL ; DIAS, JONAS ; OLIVEIRA, DANIEL DE ; Ogasawara, Eduardo ; MATTOSO, MARTA ; COUTINHO, ALVARO L. G. A. ; ROCHINHA, FERNANDO A.. Analysis of flow-induced vibration model under uncertainties using an iterative workflow. Em: 1st International Symposium on Uncertainty Quantification and Stochastic Modeling (Uncertainties 2012), 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        34. SOUSA, V. ; CHIRIGATI, F. ; OGASAWARA, E. ; DIAS, J. ; OLIVEIRA, D. ; PORTO, F. ; VALDURIEZ, P. ; MATTOSO, M. L. Q.. Uma avaliação da Distribuição de Atividades Estática e Dinâmica em Ambientes Paralelos usando o Hydra. Em: CSBC 2011 - e-Science Workshop, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        35. OLIVEIRA, D. ; OGASAWARA, E. ; BAIÃO, FERNANDA ; MATTOSO, M. L. Q.. Adding Ontologies to Scientific Workflow Composition. Em: XXVI Simposio Brasileiro de Banco de Dados, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        36. VIANA, VITOR ; OLIVEIRA, D. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. SciCumulus-ECM: Um Serviço de Custos para a Execução de Workflows Científicos em Nuvens Computacionais. Em: XXVI Simposio Brasileiro de Banco de Dados, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        37. DIAS, J. ; OGASAWARA, E. ; OLIVEIRA, D. ; PORTO, F. ; COUTINHO, ALVARO L. G. A. ; MATTOSO, M. L. Q.. Supporting Dynamic Parameter Sweep in Adaptive and User-Steered Workflows. Em: Workshop on Workflows in Support of Large-Scale Science (WORKS 2011), 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        38. OCANA, KARY A.C.S. ; DE OLIVEIRA, DANIEL ; DIAS, JONAS ; Ogasawara, Eduardo ; MATTOSO, MARTA. Optimizing Phylogenetic Analysis Using SciHmm Cloud-based Scientific Workflow. Em: 2011 IEEE 7th International Conference on EScience (eScience), p. 62, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        39. DE OLIVEIRA, DANIEL ; OCANA, KARY ; Ogasawara, Eduardo ; DIAS, JONAS ; BAIAO, FERNANDA ; MATTOSO, MARTA. A Performance Evaluation of X-ray Crystallography Scientific Workflow Using SciCumulus. Em: Fourth IEEE 2011 International Conference on Cloud Computing (CLOUD 2011), p. 708, 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        40. OGASAWARA, E.; MARTINEZ, L. C. ; OLIVEIRA, D. ; ZIMBRAO, G. ; PAPPA, G. L. ; MATTOSO, M. L. Q.. Adaptive Normalization: A Novel Data Normalization Approach for Non-Stationary Time Series. Em: IEEE International Joint Conference on Neural Networks, p. 606-613, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        41. COUTINHO, F. ; OGASAWARA, E. ; OLIVEIRA, D. ; BRAGANHOLO, V. ; LIMA, A. A. B. ; DAVILA, A. M. R. ; MATTOSO, M.. Data Parallelism in Bioinformatics Workflows Using Hydra. Em: HPDC - Emerging Computational Methods for the Life Sciences Workshop, p. 507-515, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        42. SILVA, E. ; OGASAWARA, E. ; OLIVEIRA, D. ; BENEVIDES, M. ; MATTOSO, M. L. Q.. Especificação Formal e Verificação de Workflows Científicos. Em: Brazilian e-Science Workshop, p. 193-200, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        43. SOUSA, V. ; CHIRIGATI, F. ; MAIA, K. ; OGASAWARA, E. ; OLIVEIRA, D. ; BRAGANHOLO, V. ; MURTA, L. ; MATTOSO, M. L. Q.. SimiFlow: Uma Arquitetura para Agrupamento de Workflows por Similaridade. Em: Brazilian e-Science Workshop, p. 201-208, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        44. OLIVEIRA, D. ; OGASAWARA, E. ; CHIRIGATI, F. ; SOUSA, V. ; MURTA, L. ; MATTOSO, M. L. Q.. GExpLine: A Tool for Supporting Experiment Composition. Em: Third International Provenance and Annotation Workshop (IPAW2010), p. 251-259, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        45. DIAS, J. ; RODRIGUES, C. ; OGASAWARA, E. ; OLIVEIRA, D. ; BRAGANHOLO, V. ; PACITTI, ESTHER ; MATTOSO, M. L. Q.. SciMulator: Um Ambiente de Simulação de Workflows Científicos em Redes P2P. Em: Workshop de Redes Dinâmicas e Sistemas P2P (WP2P 2010), 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        46. OLIVEIRA, D. ; OGASAWARA, E. ; BAIÃO, FERNANDA ; MATTOSO, M. L. Q.. An Adaptive Approach for Workflow Activity Execution in Clouds. Em: International Workshop on Challenges in e-Science, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        47. DE OLIVEIRA, DANIEL ; Ogasawara, Eduardo ; BAIÃO, FERNANDA ; MATTOSO, MARTA. SciCumulus: A Lightweight Cloud Middleware to Explore Many Task Computing Paradigm in Scientific Workflows. Em: 2010 IEEE International Conference on Cloud Computing (CLOUD), p. 378-385, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        48. DIAS, JONAS ; Ogasawara, Eduardo ; DE OLIVEIRA, DANIEL ; PACITTI, ESTHER ; MATTOSO, MARTA. Improving Many-Task Computing in Scientific Workflows Using P2P Techniques. Em: 3rd IEEE Workshop on Many-Task Computing on Grids and Supercomputers (MTAGS2010), p. 1-10, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        49. HORTA, FELIPE ; SOUSA, V. ; COSTA, FLAVIO ; OLIVEIRA, D. ; OCANA, K. ; OGASAWARA, E. ; DIAS, J. ; MATTOSO, M. L. Q.. Provenance traces from Chiron parallel workflow engine. Em: ProvBench: A Provenance Repository for Benchmarking (joint with BigProv 2013), 2013, Genova, Itália. EDBT '13 Proceedings of the Joint EDBT/ICDT 2013 Workshops. New York: ACM Press, p. 337-338, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        50. HORTA, FELIPE ; DIAS, JONAS ; OCANA, KARY A.C.S. ; DE OLIVEIRA, DANIEL ; Ogasawara, Eduardo ; MATTOSO, MARTA. Abstract: Using Provenance to Visualize Data from Large-Scale Experiments. Em: 2012 SC Companion: High Performance Computing, Networking, Storage and Analysis (SCC), 2012, Salt Lake City. 2012 SC Companion: High Performance Computing, Networking Storage and Analysis, p. 1418, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

      • Daniel Cardoso Moraes de Oliveira ⇔ Aline Marins Paes Carvalho (18.0)
        1. SILVA JUNIOR, D. P. ; PACITTI, E. ; PAES, A. ; OLIVEIRA, D.. Provenance-and machine learning-based recommendation of parameter values in scientific workflows. PEERJ COMPUTER SCIENCE. v. 7, p. e606, issn: 2376-5992, 2021.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        2. NASCIMENTO, ANDRÉ ; SILVA, VÍTOR ; PAES, ALINE ; OLIVEIRA, DANIEL. An incremental reinforcement learning scheduling strategy for data-intensive scientific workflows in the cloud. CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE. v. 33, p. 1-32, issn: 1532-0626, 2021.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        3. PAES, A. ; OLIVEIRA, D.. Running Multi-relational Data Mining Processes in the Cloud: a Practical Approach for Social Networks. Communications in Computer and Information Science (Print). v. 565, p. 3-18, issn: 1865-0929, 2015.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        4. NASCIMENTO, ANDRE ; OLIMPIO, VICTOR ; SILVA, VITOR ; PAES, ALINE ; DE OLIVEIRA, DANIEL. A Reinforcement Learning Scheduling Strategy for Parallel Cloud-Based Workflows. Em: 2019 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW), p. 817, 2019.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        5. LOURENCO, VITOR ; MANN, PAULO ; GUIMARAES, ARTUR ; PAES, ALINE ; DE OLIVEIRA, DANIEL. Towards Safer (Smart) Cities: Discovering Urban Crime Patterns Using Logic-based Relational Machine Learning. Em: 2018 International Joint Conference on Neural Networks (IJCNN), p. 1-8, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        6. OLIMPIO, V. ; NASCIMENTO, A. L. C. ; PAES, A. ; OLIVEIRA, D.. WorkflowSim4RL: Aprendizado por Reforço Aplicado a Escalonamento de Workflows Científicos em Nuvens. Em: 17º Workshop em Desempenho de Sistemas Computacionais e de Comunicação (WPerformance), 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        7. SILVA JUNIOR, D. P. ; PAES, A. ; PACITTI, E. ; OLIVEIRA, D.. FReeP: towards parameter recommendation in scientific workflows using preference learning. Em: XXXIII Simpósio Brasileiro de Banco de Dados, p. 211-216, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        8. VALERIANO, K. ; PAES, A. ; OLIVEIRA, D.. Análise da Evolução dos Discursos de Pré-candidatos à Presidente por meio de Representações Linguísticas Vetoriais. Em: Symposium on Knowledge Discovery, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        9. SILVA JUNIOR, D. P. ; PAES, A. ; OLIVEIRA, D.. Predição de Falhas em Workflows Científicos em Nuvens baseada em Aprendizado de Máquina. Em: Brazilian e-Science Workshop (E-SCIENCE), 2017.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        10. LOURENCO, V. N. ; MANN, P. ; PAES, A. ; OLIVEIRA, D.. SiAPP: Um Sistema para Análise de Ocorrências de Crimes Baseado em Aprendizado Lógico-Relacional. Em: Simpósio Brasileiro de Sistemas de Informação - SBSI 2016, p. 168-175, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        11. TALLARIDA, G. ; OCAÑA, K. ; PAES, A. ; BRAGANHOLO, V. ; OLIVEIRA, D.. Gerência de Incerteza em Bancos de Dados de Proveniência em Bioinformática. Em: XXXI Simpósio Brasileiro de Banco de Dados, p. 1-6, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        12. CAMARA, R. V. ; PAES, A. ; OLIVEIRA, D.. Aplicação de Árvores de Decisão para Recomendação de Parâmetros em Workflows Científicos. Em: Brazilian e-Science Workshop (E-SCIENCE), p. 1-8, 2015.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        13. SALES, RAINIER ; CLUA, ESTEBAN ; OLIVEIRA, DANIEL DE ; PAES, ALINE ; CHAIMOWICZ, LUIZ ; NUNES, MARIA AUGUSTA S. N.. Evaluation between humans and affective NPC in digital gaming scenario. Em: 2014 IEEE 3rd International Conference on Serious Games and Applications for Health (SeGAH), p. 1-8, 2014.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        14. ALMEIDA, M. ; PAES, A. ; OLIVEIRA, D.. Uma Ferramenta para Mineração Multi-relacional de Redes Sociais Baseada em Programação Lógica e Workflows. Em: III Brazilian Workshop on Social Network Analysis and Mining (BraSNAM 2014), 2014.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        15. SALES, R. ; CLUA, E. ; OLIVEIRA, D. ; PAES, A.. An Artificial Emotional Agent-based Architecture for Games Simulation. Em: 12th International Conference on Entertainment Computing, v. 8215, p. 156-159, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        16. SALES, R. ; CLUA, E. ; OLIVEIRA, D. ; PAES, A.. An Experimental Analysis of NPC as Affective Agents in Real World-based Games. Em: XII Simpósio Brasileiro de Jogos e Entretenimento Digital (SBGames), p. 174-183, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        17. SALES, R. ; CLUA, E. ; OLIVEIRA, D. ; PAES, A.. An Architecture Coupled with a Provenance Model for Affective Simulations in Games Based on Real World. Em: XII Simpósio Brasileiro de Jogos e Entretenimento Digital (SBGames), p. 25-34, 2013.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        18. FALCI, M. L. F. ; MAGDALENO, A. M. ; PAES, A. ; BRAGANHOLO, V. ; OLIVEIRA, D.. Multimodal Provenance-based Analysis of Collaboration in Business Processes. Journal of Information and Data Management - JIDM. 2021.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

      • Daniel Cardoso Moraes de Oliveira ⇔ Alvaro Luiz Gayoso de Azeredo Coutinho (13.0)
        1. SILVA, VÍTOR ; NEVES, LEONARDO ; SOUZA, RENAN ; COUTINHO, A. L. G. A., Alvaro L.G.A. Coutinho ; OLIVEIRA, D. C. M. ; MATTOSO, MARTA. Adding domain data to code profiling tools to debug workflow parallel execution. Future Generation Computer Systems. v. 110, p. 422-439, issn: 0167-739X, 2020.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        2. SILVA, VÍTOR ; CAMPOS, VINÍCIUS ; GUEDES, THAYLON ; CAMATA, JOSÉ ; DE OLIVEIRA, DANIEL ; COUTINHO, A. L. G. A., Alvaro L.G.A. Coutinho ; Valduriez, Patrick ; MATTOSO, M. L. Q.. DfAnalyzer: Runtime Dataflow Analysis Tool for Computational Science and Engineering Applications. SoftwareX. v. 12, p. 100592, issn: 2352-7110, 2020.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        3. SILVA, VÍTOR ; LEITE, JOSÉ ; CAMATA, JOSÉ J. ; DE OLIVEIRA, DANIEL ; COUTINHO, ALVARO L.G.A. ; VALDURIEZ, PATRICK ; MATTOSO, MARTA. Raw data queries during data-intensive parallel workflow execution. Future Generation Computer Systems. v. 75, p. 402-422, issn: 0167-739X, 2017.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        4. GUERRA, G. ; ROCHINHA, F. A. ; ELIAS, R. ; Oliveira, D. ; OGASAWARA, E. ; DIAS, J. ; Mattoso, Marta ; MATTOSO, M. L. Q. ; COUTINHO, A. L. G. A., Alvaro L.G.A. Coutinho. UNCERTAINTY QUANTIFICATION IN COMPUTATIONAL PREDICTIVE MODELS FOR FLUID DYNAMICS USING A WORKFLOW MANAGEMENT ENGINE. International Journal for Uncertainty Quantifications (Print). v. 2(1), p. 53-71, issn: 2152-5080, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        5. VALDURIEZ, PATRICK ; MATTOSO, MARTA ; AKBARINIA, R. ; BORGES, H. ; CAMATA, J. ; COUTINHO, ALVARO L. G. A. ; GASPAR, D. ; LEMUS, N. ; LIU, J. ; LUSTOSA, H. ; MASSEGLIA, F. ; SILVA, F. N. ; SILVA, VÍTOR ; SOUZA, R. ; OCANA, KARY ; OGASAWARA, E. ; OLIVEIRA, D. ; PACITTI, ESTHER ; PORTO, F. ; SHASHA, D.. Scientific Data Analysis Using Data-Intensive Scalable Computing: the SciDISC Project. Em: 1st LADaS - Latin American Data Science Workshop, p. 1-8, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        6. Camata, J.J. ; CELA, J. M. ; COSTA, D. L. ; Coutinho, A.L.G.A. ; FERNANDEZ-GALISTEO, D. ; JIMENEZ, C. ; KOURDIOUMOV, V. ; MATTOSO, M. L. Q. ; MAYO-GARCIA, R. ; MIRAS, T. ; MORINIGO, J. A. ; NAVARRO, J. ; Oliveira, D. ; RODRIGUEZ-PASCUAL, M. ; SOUZA, V. S. ; SOUZA, R. ; VALDURIEZ, P.. Applying future Exascale HPC methodologies in the energy sector. Em: Russian Supercomputing Days 2016, p. 9-19, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        7. SOUZA, V. S. ; leonardo neves ; SOUZA, R. ; Alvaro L G A Coutinho ; Carvalho, D. ; MATTOSO, Marta L Queiros. Integrating domain-data steering with code-profiling tools to debug data-intensive workflows. Em: Proceedings of the 11th Workshop on Workflows in Support of Large-Scale Science co-located with The International Conference for High Performance Computing, v. 1, p. 59-63, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        8. MAYO-GARCIA, R. ; Camata, J.J. ; CELA, J. M. ; COSTA, D. L. ; Alvaro L G A Coutinho ; FERNANDEZ-GALISTEO, D. ; JIMENEZ, C. ; KOURDIOUMOV, V. ; MATTOSO, Marta L Queiros ; MIRAS, THOMAS ; MORINIGO, J. A. ; NAVARRO, J. ; NAVAUX, P. O. A. ; Oliveira, D. ; RODRIGUEZ-PASCUAL, M. ; SOUZA, V. S. ; SOUZA, R. ; VALDURIEZ, P.. Enhancing Energy Production with Exascale HPC Methods. Em: Latin American High Performance Computing Conference (CARLA 2016), v. 667, p. 235-248, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        9. SOUZA, V. S. ; Camata, J.J. ; Oliveira, D. ; Alvaro L G A Coutinho ; VALDURIEZ, P. ; MATTOSO, Marta L Queiros. In Situ Data Steering on Sedimentation Simulation with Provenance Data. Em: The International Conference for High Performance Computing, Networking, Storage and Analysis, 2016, Salt Lake City, Utah. Proc. of the International Conference for High Performance Computing, Networking, Storage and Analysis, v. 1, p. 1-2, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        10. Bernadá, G.M.G. ; Rochinha, Fernando A. ; Elias, R. N. ; OLIVEIRA, D. ; OGASAWARA, E. ; Dias, J. F. ; CHIRIGATI, F. ; braganholo, v ; MATTOSO, Marta L Queiros ; Coutinho, A. L. G. A.. Cleaning the Mess: Progress in Scientific Workflows for Managing Large Scale Simulations. Em: Colloquium on Advances in Computational Science, Engineering and Mathematics, 2012, Austin, TX. Proc. Colloquium on Advances in Computational Science, Engineering and Mathematics, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        11. Dias, J. F. ; OGASAWARA, E. ; Oliveira, D. ; Porto, F. ; Coutinho, A. L. G. A. ; MATTOSO, M. L. Q.. Adaptative and User-Steered Workflows for Computational Mechanics Experiments. Em: 10th World Congress on Computational Mechanics, 2012, São Paulo, SP. Proc. 10th World Congress on Computational Mechanics, p. 257-257, 2012.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        12. Bernadá, G.M.G. ; Rochinha, Fernando A. ; Elias, R. N. ; Coutinho, A. L. G. A. ; braganholo, v ; OLIVEIRA, D. ; OGASAWARA, E. ; Seabra, F. ; ALMEIDA FILHO, R. ; MATTOSO, M. L. Q.. Scientific Workflow Management System Applied to Uncertainty Quantification in Computational Fluid Mechanics. Em: 16th International Conference on Finite Elements in Flow Problems (FEF 2011), 2011, Munique. Proceedings of the 16th International Conference on Finite Elements in Flow Problems (FEF 2011), 2011.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        13. MATTOSO, M. L. Q. ; Coutinho, A. L. G. A. ; Elias, R. N. ; OLIVEIRA, D. ; OGASAWARA, E.. Exploring Parallel Parameter Sweep in Scientific Workflows. Em: 9th World Congress on Computational Mechanics and 4th Asian Pacific Congress on Computational Mechanics, 2010, Sydney, Australia. Proc. 9th World Congress on Computational Mechanics and 4th Asian Pacific Congress on Computational Mechanics, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

      • Daniel Cardoso Moraes de Oliveira ⇔ Lúcia Maria de Assumpção Drummond (8.0)
        1. TEYLO, LUAN ; DEPAULA, UBIRATAM ; FROTA, YURI ; DEOLIVEIRA, DANIEL ; DRUMMOND, LÚCIAM.A.. A hybrid evolutionary algorithm for task scheduling and data assignment of data-intensive scientific workflows on clouds. Future Generation Computer Systems. v. 76, p. 1-17, issn: 0167-739X, 2017.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        2. COUTINHO, RAFAELLI ; FROTA, YURI ; OCAÑA, KARY ; OLIVEIRA, DANIEL DE ; A. DRUMMOND, LÚCIA M.. A Dynamic Cloud Dimensioning Approach for Parallel Scientific Workflows: a Case Study in the Comparative Genomics Domain. Journal of Grid Computing. v. 14, p. 443-461, issn: 1570-7873, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        3. COUTINHO, RAFAELLI DE C. ; Drummond, Lúcia M.A. ; FROTA, YURI ; DE OLIVEIRA, DANIEL. Optimizing virtual machine allocation for parallel scientific workflows in federated clouds. Future Generation Computer Systems. v. 46, p. 51-68, issn: 0167-739X, 2015.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        4. COUTINHO, RAFAELLI ; FROTA, YURI ; OCAÑA, KARY ; DE OLIVEIRA, DANIEL ; Drummond, Lúcia M. A.. Mirror Mirror on the Wall, How Do I Dimension My Cloud After All?. Computer Communications and Networks. 1ed. Em: Nikos Antonopoulos (Editor); Lee Gillam (Editor). (Org.). Computer Communications and Networks. 2ed.Springer. : Springer International Publishing. 2017.p. 27-58.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        5. JESUS, L. A. ; DRUMMOND, LÚCIA MARIA DE A. ; DE OLIVEIRA, DANIEL. Eeny Meeny Miny Moe: choosing the fault tolerance technique for my cloud workflow. Em: Latin American High Performance Computing Conference (CARLA 2017), v. 796, p. 321-336, 2017.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        6. JESUS, L. A. ; OLIVEIRA, D. ; Drummond, Lúcia M.A.. Tolerância a Falhas de Workflows Científicos Executados em Nuvens Usando Checkpoints. Em: XVII Simpósio em Sistemas Computacionais de Alto Desempenho, v. 1, p. 1-12, 2016.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        7. Ubiratam Carvalho de Paula Junior ; Drummond, Lúcia M. A. ; OLIVEIRA, D. ; ABITBOL, Y. ; BARBOSA, V. C.. Handling flash-crowd events to improve the performance of web applications. Em: 30th ACM/SIGAPP Symposium On Applied Computing., p. 769, 2015.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        8. Rafaelli de Carvalho Coutinho ; Drummond, Lúcia M.A. ; ABITBOL, Y. ; OLIVEIRA, D. ; OCANA, K.. Evaluating Grasp-based cloud dimensioning for comparative genomics: A practical approach. Em: 2014 IEEE International Conference On Cluster Computing (CLUSTER), p. 371, 2014.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

      • Daniel Cardoso Moraes de Oliveira ⇔ Agma Juci Machado Traina (5.0)
        1. BLANCO, G. ; Traina, Agma J. M. ; AZEVEDO-MARQUES, P. M. ; TRAINA JR, Caetano ; JORGE, A. E. S. ; OLIVEIRA, D. ; BEDO, M. V. N.. A superpixel-driven deep learning approach for the analysis of dermatological wounds. COMPUTER METHODS AND PROGRAMS IN BIOMEDICINE. v. 183, p. 105079-9, issn: 0169-2607, 2020.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        2. BEDO, M. V. N. ; OLIVEIRA, D. ; TRAINA, AGMA J.M. ; TRAINA JR, Caetano. Beyond hit-or-miss: a comparative study of synopses for similarity searching. Journal of Information and Data Management - JIDM. v. 9, p. 36-52, issn: 2178-7107, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        3. SILVA, WELLINGTON S. ; JASBICK, DANIEL L. ; WILSON, RODRIGO E. ; AZEVEDO-MARQUES, PAULO M. ; TRAINA, AGMA J. M. ; SANTOS, LUCIO F. D. ; JORGE, ANA E. S. ; DE OLIVEIRA, DANIEL ; BEDO, MARCOS V. N.. A Two-Phase Learning Approach for the Segmentation of Dermatological Wounds. Em: 2019 IEEE 32nd International Symposium on ComputerBased Medical Systems (CBMS), v. 1, p. 343-348, 2019.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        4. NOVAES, J. V. O. ; BEDO, MARCOS V. N. ; OLIVEIRA, D. ; Traina, Agma ; TRAINA JR, Caetano ; SANTOS, L.F.D.. J-EDA: A diversified similarity workbench for content-based image retrieval. Em: Sessão de Demos e Aplicações do 34o. Simpósio Brasileiro de Banco de Dados (SBBD 2019), v. 1, p. 36-41, 2019.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        5. SANTOS, LUCIO F. D. ; BLANCO, GUSTAVO ; OLIVEIRA, DANIEL DE ; TRAINA, AGMA J. M. ; TRAINA JR., CAETANO ; BEDO, MARCOS V. N.. Exploring Diversified Similarity with Kundaha. Em: 27th ACM Intl Conference on Information and Knowledge Management (CIKM 2018) - Demo Track, v. 1, p. 1903-4, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

      • Daniel Cardoso Moraes de Oliveira ⇔ Marcos Kalinowski (3.0)
        1. NETO, CARLOS ; NETO, AMADEU ; KALINOWSKI, MARCOS ; MORAES DE OLIVEIRA, DANIEL ; SABOU, MARTA ; WINKLER, DIETMAR ; BIFFL, STEFAN. Using Model Scoping with Expected Model Elements to Support Software Model Inspections: Results of a Controlled Experiment. Em: International Conference on Enterprise Information Systems (ICEIS), p. 107-118, 2019.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        2. LAIGNER, RODRIGO ; KALINOWSKI, MARCOS ; LIFSCHITZ, SERGIO ; SALVADOR MONTEIRO, RODRIGO ; DE OLIVEIRA, DANIEL. A Systematic Mapping of Software Engineering Approaches to Develop Big Data Systems. Em: 2018 44th Euromicro Conference on Software Engineering and Advanced Applications (SEAA), p. 446-453, 2018.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
        3. TITO, LUCAS ; ESTEBANEZ, ALEXANDRE ; MAGALHÃES, ANDRÉA ; DE OLIVEIRA, DANIEL ; KALINOWSKI, MARCOS. A Systematic Mapping of Software Requirements Negotiation Techniques. Em: International Conference on Enterprise Information Systems (ICEIS), p. 518, 2017.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

      • Daniel Cardoso Moraes de Oliveira ⇔ Ana Tereza Ribeiro de Vasconcelos (1.0)
        1. OCAÑA, KARY A.C.S. ; GALHEIGO, MARCELO ; OSTHOFF, CARLA ; GADELHA, LUIZ M.R. ; PORTO, FABIO ; GOMES, ANTÔNIO TADEU A. ; DE OLIVEIRA, DANIEL ; Vasconcelos, Ana Tereza. BioinfoPortal: A scientific gateway for integrating bioinformatics applications on the Brazilian national high-performance computing network. Future Generation Computer Systems. v. 107, p. 192-214, issn: 0167-739X, 2020.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

      • Daniel Cardoso Moraes de Oliveira ⇔ Guilherme Horta Travassos (1.0)
        1. Mattoso, Marta ; Werner, Claudia ; TRAVASSOS, G. H. ; Braganholo, Vanessa ; Ogasawara, Eduardo ; Oliveira, Daniel De ; Cruz, Sergio Manuel Serra Da ; Martinho, Wallace ; Murta, Leonardo. Towards supporting the life cycle of large scale scientific experiments. International Journal of Business Process Integration and Management (Print). v. 5, p. 79-92, issn: 1741-8763, 2010.
          [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]




    (*) Relatório criado com produções desde 2010 até 2021
    Data de processamento: 06/11/2021 15:23:42