Ferramenta usa uma versão adaptada do GPT-2 para identificar padrões de mutação e estimar histórias evolutivas.
Pesquisadores da Universidade do Oregon, nos EUA, criaram uma inteligência artificial capaz de ler o DNA de forma parecida com a leitura de texto feita por modelos como o ChatGPT. A ferramenta identifica padrões de mutações no genoma e reconstrói relações de ancestralidade em poucos minutos.
Uma IA treinada na linguagem da vida
O estudo saiu na revista Proceedings of the National Academy of Sciences. A equipe apresenta o modelo como o primeiro sistema de linguagem voltado à genética de populações.
A ideia parte de uma comparação conhecida. O DNA funciona como um texto escrito com quatro letras: A, T, C e G. Dessa forma, as mudanças nesse texto, chamadas mutações, ajudam cientistas a seguir rastros deixados pela evolução.
Essas mutações passam de geração em geração. Isso porque, quando uma região do DNA acumula muitas alterações, ela costuma apontar para um ancestral comum mais distante. Quando tem poucas mudanças, a ligação tende a ser mais recente.
Como o modelo volta no tempo
A equipe adaptou uma arquitetura GPT-2 para analisar genomas. Só que, em vez de treinar o modelo com textos em inglês, os pesquisadores usaram simulações de evolução genética.
Essas simulações recriaram processos evolutivos em diferentes grupos, incluindo bactérias, roedores, mosquitos e primatas. Com isso, a IA aprendeu a reconhecer padrões biológicos que indicam quando dois genes compartilharam um ancestral comum.
Esse momento recebe o nome de “tempo de coalescência”. Ou seja, é uma espécie de ponto de encontro no passado da árvore evolutiva.
Andrew Kern, biólogo computacional da Universidade do Oregon, afirmou que avanços da IA generativa podem ajudar áreas que vão além dos chatbots. Ao Phys, ele disse que a equipe pegou forças do mundo da inteligência artificial e levou essas ferramentas para um campo ainda pouco explorado.
Minutos em vez de dias
Os métodos clássicos de estatística continuam como referência na área. Ou seja, eles conseguem traduzir mutações em história evolutiva com alta precisão.
O problema aparece na escala. Essas abordagens podem levar horas ou dias para analisar um único cromossomo de mosquito. Porém, a nova ferramenta faz esse trabalho em minutos.
Kevin Korfmann, autor principal do estudo, explicou que o modelo não precisa avaliar cada mutação isoladamente. Ele lê padrões porque o trabalho estatístico mais pesado ocorreu antes, durante o treinamento.
Por que isso importa para doenças
A velocidade pode ajudar pesquisas com grandes bancos de dados genéticos. Ela também funciona com conjuntos incompletos, algo comum em bases de DNA de mosquitos.
Esse ponto interessa diretamente ao estudo da malária. Mosquitos que transmitem a doença desenvolvem resistência a inseticidas em várias populações.
Por outro lado, com a nova IA, pesquisadores podem investigar quando genes de resistência surgiram e como se espalharam. Isso pode revelar detalhes importantes sobre a evolução de um dos principais vetores da malária.
O próximo passo
A ferramenta ainda reconstrói ancestralidade entre duas linhagens. Agora, Kern e Korfmann querem avançar para árvores genealógicas completas, com múltiplas linhagens.
Porém, a promessa não está em substituir toda a estatística clássica. Está em acelerar a leitura de genomas e abrir novas perguntas para a biologia evolutiva.
Por: Hemerson Brandão


