Symbolic Regression searches for the simplest mathematical expression that accurately fits a given data. It thus generates models that are easier to interpret than many state-of-the-art nonlinear regression models. So far, the algorithms used to find solutions suffer from the problems of exploring a huge and rugged search space. This was severally alleviated by the introduction of the Interaction-Transformation data type and the SymTree algorithm that constrains the search space to a set of simple expressions. This project has the main goal of applying this algorithm to real-world scenarios in different problem domains and to extend this type to allow a complexity control of the expression.
Grant agency: Fapesp (Brasil)
Imageamento sísmico é reconhecidamente um problema de Geofísica que é central à etapa de exploração de petróleo. A solução deste problema se baseia em técnicas de Reverse Time Migration (RTM) como Common-Reflection-Surface (CRS) e Full Waveform Inversion (FWI) que realizam computações complexas em volumes gigantescos de dados. Técnicas como FWI, por exemplo, oferecem soluções precisas para o problema de imageamento sísmico, a um custo computacional muito elevado. Por outro lado, a disponibilização pela indústria de nuvens com nós CPU-GPU tem indicado que problemas como FWI podem se beneficiar de um número significativo de nós CPU-GPU com elevada capacidade computacional. A meta deste projeto é desenvolver uma plataforma, chamada BR-CLOUD, baseada em padrões da indústria, que permita uma solução eficiente na nuvem para problemas complexos de imageamento sísmico. Para viabilizar esta plataforma pretende-se integrar e ampliar modelos de execução paralela já usados pela indústria como OpenMP, MPI e CUDA. O modelo resultante deve ser totalmente compatível com estes padrões, ser independente de versões de ferramentas, e permitir o descarregamento de programas científicos complexos em nuvens heterogêneas de maneira transparente, balanceada e tolerante à falhas. Descarregamento de computação (i.e. computation offloading) é um modelo de programação paralela em que os fragmentos do programa (por exemplo, laços quentes) são anotados para que sua execução seja realizada em hardware dedicado ou dispositivos aceleradores como GPUs. A equipe deste projeto possui uma grande experiência em paralelização de código, e propôs o primeiro modelo que estendeu o padrão OpenMP para permitir descarregamento de computação transparente na nuvem. Este modelo, chamado OmpCloud, segue o padrão OpenMP, e foi testado com uma aplicação científica complexa nas nuvens da Amazon AWS e Microsoft Azure, produzindo bons resultados. Este projeto tem dois objetivos. Primeiro pretende-se estender OmpCloud para viabilizar paralelismo de tarefas de OpenMP 4.X na nuvem, integrando o modelo resultante de maneira transparente com drivers MPI. Isto permitirá a execução não bloqueante e pipelined das tarefas de formatação e distribuição de dados com a computação em GPU dos kernels dos programas. Espera-se com isto superpor latências de execução temporal e espacialmente de modo a melhorar o desempenho final da aplicação. O segundo objetivo deste projeto é desenvolver técnicas de otimização de código para GPUs que melhorem a localidade de referência e a latência de descarregamento de dados.
Grant agency: Petrobrás (Brazil)
This project has the aim to develop and apply machine learning and data analytics techniques do massive data sets of materials properties to build predictive models and extract design rules for high throughput virtual screening of new materials. We plan to apply these techniques to public available data, as well as data collected from designed quantum-chemistry calculations performed by the team members of the CMSC Division. Thus, such combination of knowledges from different fields have the potential to yield cutting-edge advances in material science.
Grant agency: Shell/FAPESP
The SWAMP project develops IoT based methods and approaches for smart water management in precision irrigation domain, and pilots them in Italy, Spain, and Brazil (2). Water is vital for ensuring food security to the world’s population, and agriculture is the biggest consumer amounting for 70% of freshwater. The water wastages are caused mainly by leakages in distribution and irrigation systems, and in the field application methods. The most common technique, surface irrigation wastes a high percentage of the water by wetting areas where no plants benefit from it. Localized irrigation can use water more efficiently and effectively, avoiding both under-irrigation and over-irrigation. However, in an attempt to avoid under-irrigation, farmers feed more water than is needed resulting not only to productivity losses, but also water is wasted. Therefore, technology should be developed and deployed for sensing the level of water needed by the plantation and for flowing the water to places where and when needed. The SWAMP project addresses these issues by use of the Internet of Things (IoT), data analytics, autonomous devices and other related technologies. The challenges addressed by SWAMP project are following: 1) Reducing effort in software development for IoT-based smart applications. 2) Automating advanced platforms and integrating different technologies and components. 3) The integration of heterogeneous and advanced sensors, particularly flying sensors (drones) providing precision in the water supply for irrigation. 4) The use of a Software Platform together with technologies such as IoT, Big Data, Cloud/Fog and drones for the deployment of pilot applications for smart water management. 5) Proposing, testing and validating new business models for using IoT in smart water management settings. 6) Technological components must be flexible and adaptable enough in order to adapt to different contexts and to be replicable to different locations and contexts.
Grant agency: RNP (Brazil), EU Comission (Europe)