A Meta apresentou hoje (29) o Make-A-Video, um gerador de imagens a partir de texto baseado em IA capaz de produzir vídeos. Semelhante ao conhecido DALL-E 2, da OpenAI, e Imagen, do Google, o projeto da empresa de Mark Zuckerberg explora IA e aprendizagem de máquina para “criar ilustrações fotorrealistas” a partir de palavras, frases ou de outras imagens.
O Make-A-Video é um complemento ao Make-A-Scene, projeto semelhante da Meta que utiliza IA para gerar imagens a partir de descrições em texto. Mais robusta, a nova plataforma vai além da fabricação de imagens estáticas e é capaz de criar cenas mais complexas, com múltiplos quadros e variações de uma mesma cena.
Os resultados destacados pela Meta são bem impressionantes, embora estejam próximos de cair no conhecido “Vale da estranheza” em alguns exemplos. Vale conferir a reprodução de “um urso pintando um retrato de urso”, “robô dançando na times square” ou ficar assustado com “um gato segurando um controle remoto”.
A sequência de quadros tende a ser coerente e passar a sensação de movimento, embora ainda existam algumas leves inconsistências entre um estado e outro.
Como funciona o Make-A-Video
Assim como as demais inteligências artificiais text-to-image (“texto para imagem”, em tradução livre), o Make-A-Video toma como base milhões de dados já existentes para gerar novas imagens. Daí, os avanços do algoritmo possibilitam a criação de quadros sequenciais, como se a IA pudesse “prever” o próximo estado da figura.
“Queremos ser cuidadosos sobre como construímos novos sistemas de IA generativos como este. O Make-A-Video usa conjuntos de dados disponíveis publicamente, o que adiciona um nível extra de transparência à pesquisa”, esclareceu a Meta.
Todo o catálogo, porém, é analisado de forma cuidadosa pela Meta, a fim de “reduzir o risco de geração de conteúdo nocivo”. Além disso, todo o material produzido pela IA é etiquetado com marcas d’água para garantir que as criações não sejam usadas para enganar o público.
Se estiver interessado no projeto, pode aprofundar seus conhecimentos consultando a documentação oficial do Make-A-Video.
Por: Igor Almenara