Uma equipe de pesquisadores da Apple criou um novo modelo de inteligência artificial capaz de cortar, redimensionar, aplicar filtros, modificar objetos inteiros e fazer uma série de edições avançadas em fotos.
A novidade foi batizada de MLLM-Guided Image Editing (MGIE) e projetada em parceria com a Universidade da Califórnia, nos Estados Unidos. Essa é uma das primeiras iniciativas públicas envolvendo inteligência artificial “moderna” por parte da empresa.
Pedido simples, resultado complexo
Em tese, o MGIE não foge ao que tecnologias semelhantes como DALL-3 e Midjourney já conseguem entregar atualmente. Contudo, o diferencial do modelo de IA da Apple seria a sua alta capacidade de interpretação: ele consegue identificar e executar qualquer pedido do usuário — tornando-se acessível mesmo para quem jamais tocou em um programa de edição.
Explicando melhor, a inteligência artificial da Maçã combina dois diferentes modelos de linguagem multimodal, sendo o primeiro capaz de interpretar solicitações e o segundo voltado para “desvendar” o que a pessoa tem em mente, mesmo que a descrição enviada não tenha sido técnica o suficiente.
Por exemplo, se alguém pedir um “céu mais azul em uma foto”, o MGIE pode compreender que o brilho da foto deve ser aumentado. Ou se o usuário solicitar que a foto de uma pizza de calabresa aparente ser mais saudável, a IA pode substituir a carne por uma cobertura de legumes e vegetais.
Se o resultado não for o desejado, o usuário pode solicitar uma nova interpretação, cabendo à inteligência artificial generativa mexer em outros aspectos da imagem até que chegue em um resultado satisfatório.
Apesar de oferecer tal nível de precisão, a Gigante de Cupertino destaca que os prompts devem ser claros e detalhados, a fim de que as edições cheguem o mais próximo possível do resultado esperado.
Onde baixar o MGIE
Desenvolvedores e entusiastas de tecnologia já pode acessar o MGIE, que foi disponibilizado para download através do GitHub no endereço github.com/apple/ml-mgie. Outro repositório que conta com a novidade da Apple é o Hugging Face Spaces, disponível em huggingface.co.
A Big Tech não deu detalhes quanto à aplicação do novo modelo em seus produtos, abrindo brechas para uma infinidade de especulações — quem sabe o MGIE não integre o iOS 18 e também venha equipado no iPhone 16 e no recém-lançado Apple Vision Pro. Resta aguardar para saber mais detalhes.
Fonte: CanalTech