segunda-feira,20 maio, 2024

Apple cria IA que edita fotos com base em comando de texto

Uma equipe de pesquisadores da Apple criou um novo modelo de inteligência artificial capaz de cortar, redimensionar, aplicar filtros, modificar objetos inteiros e fazer uma série de edições avançadas em fotos.

A novidade foi batizada de MLLM-Guided Image Editing (MGIE) e projetada em parceria com a Universidade da Califórnia, nos Estados Unidos. Essa é uma das primeiras iniciativas públicas envolvendo inteligência artificial “moderna” por parte da empresa.

Pedido simples, resultado complexo

Em tese, o MGIE não foge ao que tecnologias semelhantes como DALL-3 e Midjourney já conseguem entregar atualmente. Contudo, o diferencial do modelo de IA da Apple seria a sua alta capacidade de interpretação: ele consegue identificar e executar qualquer pedido do usuário — tornando-se acessível mesmo para quem jamais tocou em um programa de edição.

Explicando melhor, a inteligência artificial da Maçã combina dois diferentes modelos de linguagem multimodal, sendo o primeiro capaz de interpretar solicitações e o segundo voltado para “desvendar” o que a pessoa tem em mente, mesmo que a descrição enviada não tenha sido técnica o suficiente.

Por exemplo, se alguém pedir um “céu mais azul em uma foto”, o MGIE pode compreender que o brilho da foto deve ser aumentado. Ou se o usuário solicitar que a foto de uma pizza de calabresa aparente ser mais saudável, a IA pode substituir a carne por uma cobertura de legumes e vegetais.

Se o resultado não for o desejado, o usuário pode solicitar uma nova interpretação, cabendo à inteligência artificial generativa mexer em outros aspectos da imagem até que chegue em um resultado satisfatório.

Apesar de oferecer tal nível de precisão, a Gigante de Cupertino destaca que os prompts devem ser claros e detalhados, a fim de que as edições cheguem o mais próximo possível do resultado esperado.

Onde baixar o MGIE

Desenvolvedores e entusiastas de tecnologia já pode acessar o MGIE, que foi disponibilizado para download através do GitHub no endereço github.com/apple/ml-mgie. Outro repositório que conta com a novidade da Apple é o Hugging Face Spaces, disponível em huggingface.co.

A Big Tech não deu detalhes quanto à aplicação do novo modelo em seus produtos, abrindo brechas para uma infinidade de especulações —  quem sabe o MGIE não integre o iOS 18 e também venha equipado no iPhone 16 e no recém-lançado Apple Vision Pro. Resta aguardar para saber mais detalhes.

Fonte: CanalTech

360 News
360 Newshttp://www.360news.com.br
1º Hub de notícias sobre inovação e tendências da região Centro-Oeste e Norte do Brasil.

LEIA MAIS

Recomendados