Serpro implementa projeto de modelo de linguagem em português com processamento exclusivo em território brasileiro. Sistema terá capacidade para analisar textos e imagens.
O Serviço Federal de Processamento de Dados (Serpro) iniciou a implementação de um projeto para criar um modelo nacional de linguagem em português, reduzindo a dependência brasileira de tecnologias estrangeiras de inteligência artificial. O “ChatGPT nacional” será desenvolvido em parceria com o setor privado e utilizará dados brasileiros para treinamento do sistema, visando maior autonomia tecnológica e cultural no campo da IA. Ele se chamará ConversAI Studio.
A estatal já utiliza modelos de código aberto em sua infraestrutura e agora avança para desenvolver um sistema próprio. Conforme reportado pela Tele.Síntese, este movimento permitirá que o governo federal gere seus próprios modelos de IA sem depender de atualizações de fornecedores internacionais.
A proteção de dados sensíveis motivou o desenvolvimento do modelo nacional, garantindo que informações estratégicas do governo sejam processadas exclusivamente em território brasileiro, sem transferência para servidores externos.
Nos próximos meses, o Serpro realizará uma consulta pública para selecionar empresas do setor privado que colaborarão no desenvolvimento do projeto. As especificações técnicas exigem que o modelo tenha no mínimo 10 bilhões de parâmetros e capacidade multimodal para processar textos e imagens.
O desenvolvimento ocorrerá nos data centers da empresa em Brasília e São Paulo. Segundo Marcelo Pita, cientista de dados, será necessário duplicar a capacidade dessas instalações nos próximos cinco anos para atender ao crescimento das demandas de IA e da reforma tributária.
ConversAI Studio
A empresa já opera uma “Plataforma de IA Generativa” com estrutura em camadas que integra diversos modelos de linguagem, como Mistral, GEMA, DeepSeek e o brasileiro Gaia. Atualmente, o Serpro atende mais de 700 clientes com soluções baseadas em inteligência artificial.
No campo da IA generativa, a estatal processa aproximadamente 50 milhões de validações mensais apenas em serviços biométricos. Novas aplicações estão em fase de testes em órgãos como a Receita Federal, Procuradoria-Geral da Fazenda Nacional e IBGE, focando na análise de dados e automação de processos administrativos.
O Conversai Studio, componente superior da plataforma, funciona como assistente conversacional treinado com bases de conhecimento de órgãos públicos e hospedado nos data centers do Serpro.
“O ConversAI Studio é como um ChatGPT para o governo. Ele permite que cada órgão converse com suas próprias normas e dados, sem que nada trafegue fora da infraestrutura estatal”, explicou Ronaldo Agra, gerente da Divisão de IA Generativa.
Carlos Rodrigo Fonseca Lima, gerente do Centro de Excelência em Ciência de Dados e IA do Serpro, destacou a importância da iniciativa: “Hoje, temos modelos open source rodando dentro do Serpro, sem qualquer saída de dados para fora. O próximo passo é construir um novo modelo com dados brasileiros, garantindo soberania operacional, tecnológica e cultural”.
Fonte: Redação Giz Br


