Pesquisadores da Universidade HSE e da Universidade Politécnica de Moscou, ambas na Rússia, descobriram que os modelos atuais de inteligência artificial (IA) são incapazes de reconhecer imagens subjetivas de maneira tão eficiente quanto os seres humanos.
Segundo os cientistas, essa dificuldade em representar características da visão natural ocorre devido à falta de proximidade com a fisiologia do olho humano. Essa deficiência limita a percepção dos sistemas de IA, impedindo que eles reconheçam nuances contidas em determinadas figuras.
“Nós descobrimos que uma inteligência artificial não é capaz de reconhecer nenhuma figura imaginária. Por exemplo, o piloto automático de um carro, ou de um avião, percebe um trailer ou uma torre de rádio no caminho, indicados apenas por luzes de sinalização, mas são incapazes de atribuir a esses objetos formas geométricas imaginárias”, explica o professor de ciência da computação Vladimir Vinnikov.
Problemas de visão
Para entender como a percepção da inteligência artificial difere da humana, os pesquisadores usaram imagens holográficas comuns, parecidas com exemplos encontrados na internet — ou utilizadas em testes psicológicos — em que as pessoas são instigadas a identificar figuras ocultas.
Eles carregaram essas fotos contendo ilusões visuais em um serviço online chamado IBM Watson Visual Recognition. Essas imagens possuíam silhuetas geométricas parcialmente ocultadas por outras formas, devido ao alto contraste com a cor do fundo dos modelos utilizados.
“O sistema tentou determinar a natureza da imagem e indicou o grau de certeza em sua resposta. Com exceção de um triângulo imaginário colorido, nenhuma outra forma oculta foi identificada pela inteligência artificial. Foi como se a IA tivesse um problema de visão que a impedisse de completar o quadro”, acrescenta Vinnikov.
Falta de imaginação
Uma pessoa com visão perfeita consegue enxergar uma ilusão de óptica se a imagem for vetorizada, ou seja, se ela incluir pontos de referência e curvas que conectam os pontos que estão faltando. A imaginação humana é capaz de completar o quadro devido ao movimento constante dos olhos e a um sistema de memória que atribui formas aos espaços em branco.
Já nos sistemas optoeletrônicos de uma inteligência artificial, tudo é organizado de maneira diferente. Ao contrário do olho humano — com uma retina em forma de hemisfério —, a matriz sensível à luz de uma IA é plana, impedindo-a de completar linhas imaginárias que conectam os fragmentos de uma ilusão geométrica. A máquina enxerga apenas o que está representado, enquanto as pessoas completam a figura com base nos seus contornos.
“Essa falta de imaginação da IA pode ser corrigida, simulando características fisiológicas que permitem ao olho humano ver cenas em duas e três dimensões. Vidas humanas podem depender dessa precisão do reconhecimento, pois um acidente pode ocorrer se o piloto automático de um carro não reconhecer um objeto com baixo contraste em relação ao fundo e não conseguir desviar a tempo”, encerra Vladimir Vinnikov.
Por: Gustavo Minari