Geradores de imagens por IA têm um sério problema de representatividade

Novo estudo mostra que imagens de objetos comuns geradas por ferramentas de IA tendem a refletir padrões americanizados

Embora os Estados Unidos representem menos de 5% da população mundial e apenas 17% do mundo fale inglês, ao inserir palavras comuns, como “casa”, em geradores de imagens de IA (como DALL-E ou Stable Diffusion), os resultados frequentemente refletem a cultura norte-americana.

Isso é um problema, como mostra um novo artigo acadêmic o apresentado recentemente na Conferência Internacional IEEE/CVF sobre Visão Computacional, em Paris.

Danish Pruthi e seus colegas do Instituto Indiano de Ciência em Bangalore analisaram os resultados de dois dos geradores de imagens mais populares do mundo e pediram a pessoas de 27 países que avaliassem o quão bem eles representavam os ambientes em que vivem.

SE VOCÊ PEDIR AO DALL-E OU AO STABLE DIFFUSION PARA CRIAR UMA IMAGEM DE UMA BANDEIRA, É PROVÁVEL QUE ELA CONTENHA LISTRAS E ESTRELAS.

Os participantes receberam imagens de casas, bandeiras, casamentos, cidades, entre outros temas, e depois foram convidados a avaliar cada uma. Fora dos Estados Unidos e da Índia, a maioria das pessoas sentiu que as ferramentas de IA geravam imagens que não refletiam sua experiência de vida.

Esse sentimento é compreensível. Se você pedir ao DALL-E ou ao Stable Diffusion para criar uma imagem de uma bandeira, é provável que ela contenha listras e estrelas – o que não faz sentido para pessoas na Eslovênia ou na África do Sul, dois dos países onde a pesquisa foi realizada.

Os resultados confirmaram a hipótese dos autores. “Era algo que nos incomodava, o fato de muitos desses modelos assumirem um contexto geográfico específico”, explica Pruthi, um dos coautores do estudo. “Queríamos entender qual é o grupo demográfico padrão para quem essa tecnologia é voltada.”

DADOS USADOS NO TREINAMENTO SÃO A CHAVE

Apesar de escolherem itens ou conceitos deliberadamente universais, como casamento e casa, Pruthi ficou surpreso com a ausência de representatividade, a menos que as ferramentas fossem explicitamente instruídas a retratar algo de um país específico.

Quando solicitadas a gerar a imagem de uma casa indiana ou alemã, a precisão aumentou, subindo em média um ponto em uma escala de um a cinco, de acordo com as avaliações dos participantes.

No entanto, a melhoria foi apenas parcial, não refletindo com precisão a realidade. Em muitos países, a pontuação ficou em torno de 3,5. “Ainda há muito espaço para melhorias para tornar esses resultados mais personalizados”, observa Pruthi.

SE OS BANCOS DE DADOS NÃO INCLUÍREM IMAGENS QUE RETRATEM A DIVERSIDADE DO MUNDO, A REPRESENTATIVIDADE SERÁ PREJUDICADA.

Este problema é uma questão que afeta toda a inteligência artificial: a qualidade dos resultados do modelo depende fortemente dos dados de treinamento. E nem sempre eles são bons.

O ImageNet, um dos principais bancos de imagens usado para treinar modelos de IA, há muito tempo é criticado por usar rótulos racistas e sexistas. Se esses bancos de dados não incluírem imagens que retratem a diversidade do mundo e a forma como as pessoas vivem, a representatividade será prejudicada.

Nem a OpenAI, a empresa que criou o DALL-E, nem a Stability AI, que produz o Stable Diffusion, responderam quando procuradas.

Para os autores do estudo, é necessário garantir a diversidade nos dados de treinamento. “Essas tecnologias são tidas como transformadoras. São consideradas facilitadoras da criatividade, e se espera que muitas atividades econômicas sejam impulsionadas por elas. Mas, se é muito mais difícil para um artista na Índia utilizá-las, isso se torna um problema sério”, diz Pruthi.

Texto: Chris Stokel-Walker

Geradores de imagens por IA têm um sério problema de representatividade

Repense a gestão para evitar a “inovação sob pressão”

Eduardo Saverin projeta o futuro das startups no BTG Tech Day em Nova York

Dados, um território em disputa

Hiperconectividade e desconexão: quais são os desafios da gestão de pessoas cinco anos após o lockdown?

As 3 tendências que estão transformando a relação entre marcas e consumidores

LEIA MAIS

China começa a montar seu supercomputador no espaço

Capacitação do TCE-MT aborda biodiversidade e gestão de recursos naturais

Inédito: vítima de queimadura recebe pele impressa em 3D

Inscreva-se no Prêmio Sebrae Mulher de Negócios e transforme sua jornada...

Trump não quer que Apple fabrique iPhones na Índia

Recomendados

Laboratório de Inovação debate engenharia de prompt com foco na atividade judicial

Big techs estão ‘vasculhando’ os EUA em busca de algo valioso

Embaixada da Itália recebe seminário sobre IA com participação do MCTI e secretários de CT&I

SOBRE NÓS

SIGA-NOS

Geradores de imagens por IA têm um sério problema de representatividade

LEIA MAIS

Recomendados

SOBRE NÓS

SIGA-NOS

AVISO DE COOKIES