Startup e UFMG criam IA inédita para análise de dados do SUS – CartaCapital

A Dadosfera, startup especializada em dados e inteligência artificial, e a Universidade Federal de Minas Gerais (UFMG) firmaram parceria para desenvolver uma tecnologia inédita de análise de dados em linguagem natural voltada ao Datasus, o departamento responsável pelas informações do Sistema Único de Saúde (SUS).

O projeto, apoiado pela Embrapii e pelo Sebrae, vai criar um modelo de linguagem natural brasileiro capaz de interpretar perguntas em português e consultar bases tabulares complexas, tornando acessíveis dados que hoje exigem conhecimento técnico avançado. A Universidade Federal do Amazonas (UFAM) também participa da iniciativa.

Democratização do acesso aos dados

O Datasus concentra milhões de registros sobre internações, tratamentos e indicadores de saúde no país. Embora os dados sejam públicos, o acesso ainda é limitado pela complexidade das planilhas e da estrutura técnica.

A nova tecnologia permitirá que qualquer pessoa faça perguntas simples, como “Quantas internações por dengue ocorreram no estado de São Paulo em 2024?”, e receba respostas automáticas e compreensíveis. O sistema buscará as informações corretas, cruzará dados de diferentes domínios e devolverá o resultado de forma direta, eliminando a necessidade de navegação por planilhas.

De acordo com Brian Zaki, COO e sócio da Dadosfera, a proposta vai além do avanço tecnológico. “Queremos democratizar o acesso aos dados de saúde pública. Dar às pessoas o poder de compreender e analisar indicadores é importante para jornalistas, estudantes, pesquisadores e qualquer cidadão interessado em acompanhar as políticas públicas e o histórico do país”, afirma.

Parceria entre universidade e startup

A ideia surgiu na própria Dadosfera, que procurou a UFMG para desenvolver a solução em conjunto. O projeto será coordenado por Marcos André Gonçalves, professor titular do Departamento de Ciência da Computação da UFMG, e subcoordenado por Altigran Soares da Silva, professor titular do Instituto de Computação da UFAM.

Para Marcos, o objetivo é tornar o acesso aos dados do SUS realmente público. “Mesmo sendo informações abertas, hoje elas estão organizadas em planilhas complexas, restritas a especialistas. Com essa tecnologia, qualquer cidadão poderá fazer perguntas em português simples e obter respostas estruturadas.”

Marcos é um dos dez cientistas brasileiros mais citados na área de ciência da computação, segundo o ranking World’s Best Scientists 2025, e coordena outro projeto de linguística computacional e tratamento de informação do Instituto Nacional de Ciência e Tecnologia (INCT), que recebeu investimento de 10 milhões de reais e deve contribuir para a nova iniciativa.

Etapas e estrutura do projeto

O desenvolvimento terá duração inicial de 12 meses, com protótipos previstos para seis meses. A tecnologia será hospedada em infraestrutura compartilhada entre UFMG e Dadosfera. Em uma segunda fase, a solução será disponibilizada ao público e poderá ser utilizada por empresas interessadas em integrar dados de saúde de forma automatizada.

A equipe conta com 11 pesquisadores, entre bolsistas de iniciação científica, mestrandos e pós-doutorandos.

Zaki destaca a relevância da colaboração entre academia e mercado. “Minha relação com a UFMG vem desde os primeiros anos do Google em Belo Horizonte, em 2007. Retomar essa parceria agora, em um projeto que pode mudar a forma como o Brasil entende seus próprios dados de saúde, é motivo de orgulho.”

Repost

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *