Alibaba lança o Qwen2.5-Omni-7B, modelo de IA multimodal open-source, visando agentes inteligentes de baixo custo e alto desempenho

Alibaba Cloud apresentou na última quinta-feira seu mais recente modelo de inteligência artificial (IA), o “Qwen2.5-Omni-7B”, parte da série Qwen. O lançamento marca um novo passo na crescente competição pelo domínio de modelos de linguagem de grande porte na China.

A movimentação ocorre no contexto da aceleração da fervorosa corrida por IA, após o impacto causado pelo modelo DeepSeek. Com o novo lançamento, a gigante chinesa visa consolidar sua posição como líder no desenvolvimento de modelos de IA multimodais, buscando um equilíbrio entre custo e desempenho.

Qwen2.5-Omni-7B é um modelo multimodal, o que significa que ele é capaz de processar múltiplos tipos de entrada, como textos, imagens, áudios e vídeos, além de gerar respostas em tempo real por meio de texto e fala natural.

De acordo com o anúncio feito pelo Alibaba, este modelo pode ser implementado em dispositivos de borda, como smartphones, mantendo alta eficiência sem comprometer o desempenho. A empresa afirma que essa combinação única faz do modelo uma base ideal para o desenvolvimento de agentes de IA ágeis e econômicos, especialmente voltados para aplicações de voz inteligente.

Modelo open-source e parceria com a comunidade

O lançamento do Qwen2.5-Omni-7B inclui sua disponibilização como open-source nas plataformas Hugging Face e Github, alinhando-se à tendência crescente na China após o modelo R1 da DeepSeek ser liberado ao público.

O conceito de software open-source se refere ao código-fonte que é liberado para modificação e redistribuição livre, o que permite aos desenvolvedores colaborar e aprimorar continuamente o modelo. Em seus esforços para expandir o acesso à IA, o Alibaba já disponibilizou mais de 200 modelos generativos ao longo dos últimos anos.

A capacidade de gerar respostas rápidas e precisas em áudio, por exemplo, pode ser uma solução inovadora em áreas como a assistência a pessoas com deficiência visual, proporcionando descrições em tempo real do ambiente ao seu redor. Essa aplicação prática reforça o potencial do modelo para gerar valor tangível em uma variedade de cenários de uso, especialmente no campo das aplicações de voz inteligente.

Acelerando a inovação em IA na China

O lançamento do Qwen2.5-Omni-7B ocorre em um momento crucial, no qual as principais empresas de tecnologia da China, incluindo o Alibaba, estão investindo pesadamente em infraestrutura de IA. Em janeiro, o Alibaba já havia apresentado uma versão atualizada de seu modelo Qwen 2.5, e recentemente lançou uma nova versão de seu assistente de IA Quark.

Além disso, a empresa anunciou um investimento de US$ 53 bilhões em sua infraestrutura de computação em nuvem e IA, valor superior ao que foi investido na última década.

O Alibaba está bem posicionado para se beneficiar da aceleração da revolução da IA na China, especialmente após a explosão da IA pós-DeepSeek, que tem impulsionado empresas como o Baidu, que lançou recentemente novos modelos multimodais.

Em um movimento estratégico importante, o Alibaba também anunciou uma parceria com a Apple para integrar a IA em iPhones vendidos na China, além de expandir a colaboração com a BMW para incorporar a tecnologia em seus próximos veículos inteligentes.

Por: Ana Luiza Figueiredo