Ferramenta agora permite criar imagens mais detalhadas a partir de descrições em linguagem natural

A OpenAI anunciou o lançamento do DALL·E 3, sua mais recente ferramenta de geração de imagens por inteligência artificial. A nova versão já está disponível para usuários dos planos ChatGPT Plus e Enterprise e promete avanços significativos em relação aos modelos anteriores, sobretudo na fidelidade com que interpreta comandos em linguagem natural.

Com o DALL·E 3, usuários conseguem gerar imagens detalhadas e realistas a partir de descrições complexas, e ainda podem solicitar ajustes diretamente na interface de conversa do ChatGPT. A funcionalidade já está em funcionamento e representa um novo patamar de integração entre texto e imagem na plataforma da OpenAI​.

Mais precisão e riqueza visual

A OpenAI afirma que o DALL·E 3 foi projetado para atender a comandos mais elaborados, o que inclui cenas com múltiplos elementos, histórias em quadrinhos e ilustrações com diálogos. A capacidade de representar mãos humanas e textos legíveis nas imagens também foi aprimorada — dois dos maiores desafios em versões anteriores do modelo.

Esses avanços foram possíveis graças ao uso de uma ferramenta de legenda de imagens mais avançada, que permitiu treinar o modelo com descrições textuais mais precisas. O resultado, diz a OpenAI, é uma maior coerência entre o que é solicitado pelo usuário e o que é entregue pela IA.

Imagem gerada por IA simula cena realista com riqueza de detalhes — um dos avanços do DALL·E 3, novo modelo da OpenAI — Foto: Divulgação/OpenAI
Imagem gerada por IA simula cena realista com riqueza de detalhes — um dos avanços do DALL·E 3, novo modelo da OpenAI — Foto: Divulgação/OpenAI

Controle de conteúdo e transparência

Segundo a empresa, o DALL·E 3 conta com filtros para impedir a criação de imagens com conteúdo violento, sexual ou discriminatório. Também estão previstas restrições à geração de imagens que reproduzam figuras públicas ou o estilo de artistas vivos, em resposta a debates sobre ética e direitos autorais no uso de inteligência artificial​.

A OpenAI também está testando uma ferramenta chamada provenance classifier, capaz de identificar com alta precisão se uma imagem foi gerada pelo DALL·E 3. Nos testes internos, o sistema obteve mais de 99% de precisão em imagens não editadas e acima de 95% mesmo após alterações simples, como cortes ou compressão de arquivo​.

Perspectivas de uso e impacto no mercado

Com a nova funcionalidade, a expectativa é que áreas como design, marketing, educação e produção de conteúdo sejam diretamente beneficiadas. A possibilidade de criar imagens detalhadas com comandos simples pode reduzir barreiras técnicas e acelerar fluxos de trabalho, especialmente para usuários que não têm familiaridade com softwares de design.

A OpenAI também disponibilizou um mecanismo para que artistas e criadores possam optar por não incluir suas obras no treinamento de futuras versões do DALL·E — uma medida em resposta às preocupações crescentes sobre uso indevido de obras autorais.

Por: Diogo Rodriguez