Novos apps para Android e recursos aprimorados de IA são algumas das novas ferramentas já disponíveis. Confira!

No último “Google I/O”, o Google lançou novas ferramentas de IA que já estão disponíveis para uso. Realizado na última terça-feira (20), o evento contou diversas novidades, como o Android XR e novos modelos do Gemini.

Além disso, o Google anunciou o novo plano Ultra e algumas ferramentas que estão disponíveis somente nos EUA. No entanto, alguns lançamentos foram globais. Como o Brasil é um dos principais mercados do Google fora dos EUA, algumas ferramentas já estão disponíveis por aqui.

Desse modo, o Giz vai listar cinco das novas ferramentas do Google que já você já pode usar no Brasil. Obviamente, a maioria envolve IA, já que o “Google I/O” teve um enorme enfoque nas melhores do Gemini. Dito isso, vamos à lista.

1. Deep Research: Google permite usar documentos para melhorar pesquisa do Gemini

Entre as principais novidades, está a atualização da ferramenta Deep Research, ou “Pesquisa Aprofunda”. Agora, é possível enviar documentos para aprimorar a análise do Google.

Os passos são bem simples. Basta você upar um documento e pedir ao Gemini para realizar uma pesquisa com base nos dados do arquivo.

Imagem: Giz Brasil/Screenshot

Uma das características notáveis da ferramenta é a melhoria na capacidade de raciocinar, entregando um levantamento aprofundado, citando novas fontes. Além disso, com a ferramenta “Canva”, a IA do Google permite que você crie gere, páginas da web, testes e resumos em áudio.

Infográfico que a IA do Google gerou com a ferramenta “Canva” após análise do Deep Research. Imagem: Giz Brasil/Screenshot

Aliás, o Google quer tornar o Gemini uma ferramenta para estudantes e a opção de testes visa melhorar o aprendizado de qualquer disciplina. Sobre os resumos em áudio, a função reflete a melhoria do modelo de IA.

2. Conversação em português: Google melhora fluidez do idioma

Este recurso não está disponível diretamente no Gemini, mas assinantes do plano Pro conseguem acessar o portal Google AI Studio e conferir as novas ferramentas disponíveis no Brasil.

Ao acessar aistudio.google.com, há o recurso “Live audio-to-audio dialog” — a função do Gemini de conversação natural.

Basta usar o microfone e perguntar qualquer coisa que a IA responde de maneira natural e mais fluida. A ferramenta usa o mesmo modelo do Gemini Live, que o Google também aprimorou com a nova atualização e você vai ver mais adiante.

O Google oferece diversas ferramentas de personalização, como a cobertura de som, o áudio proativo e o grande problema das IA: o diálogo afetuoso. Imagem: Giz Brasil/Screenshot

3. Geração de áudio

Uma das novas ferramentas mais interessantes do Google é o recurso de gerar áudio por texto, que também funciona em português. Além disso, há vários formatos narrativos, incluindo roteiro de filme, transcrição de podcast e assistente de voz.

O que você escrever, sob os rótulos de “Speaker”, o Google transforma em áudio. É possível personalizar o recurso com tons de voz assertivos, informativos, animados, firmes e muito mais. Além disso, você pode exportar o áudio.

As opções de voz em português não são tão amplas em termos de sotaque, mas o Google aprimorou bastante o idioma nesta ferramenta. Imagem: Giz Brasil/Screenshot

4. Gemini Live: Google torna diálogos mais fluídos em ferramenta de conversa 

No app do Android, o Google melhorou a ferramenta que permite compartilhar a tela, ou mostrar o ambiente ao redor pela câmera do celular e conversar com a IA em tempo real.

Agora, o Gemini consegue obter o contexto em tempo real, enviando respostas mais exatas. Se o usuário compartilha a tela, o Gemini interage com o que vê, mas não atrapalha o uso geral do aplicativo que aparece.

Quando você mostra algo pela câmera, o Gemini entende o contexto e responde conforme os prompts (ou falas, já que é uma conversação por voz em tempo real).

Imagem: Giz Brasil/Screenshot

Por exemplo, se você mostrar algum espaço da sua casa e solicitar dicas de decoração, a ferramenta identifica, contextualiza e fornece detalhes como posição e organização.

De acordo com o Google, nos próximos meses, o Gemini Live vai se integrar ao Google Workspace e outras ferramentas, como o Maps e o calendário.

Falando em Google Workspace, a última ferramenta disponível nesta lista promete revolucionar a comunicação online.

5. Ferramenta de tradução instantânea no Google Meet

O Google anunciou a tradução de voz para as chamadas do Meet, com a ferramenta traduzindo o que você diz, mas mantendo sua voz usando um novo modelo de IA.

Você pode escolher em qual idioma quer ouvir o que a outra pessoa está dizendo. Esse recurso, de fato, preserva o tom de voz da pessoa e a expressão da fala.

Contudo, ainda há somente duas opções de idioma: espanhol e inglês. O Giz Brasil testou a ferramenta com um engenheiro de software que trabalha em uma empresa britânica que desenvolve soluções de comunicação para universidades. Veja como funciona:

Como mostra o vídeo, a ferramenta, por estar em fase beta, ainda apresenta muitas falhas. Há momentos em que funciona, mas em outros a IA não consegue traduzir em tempo real e mantém em inglês.

Além disso, muitos lags e ecos atrapalham o fluxo de conversação, mesmo em conexões por cabo. Mas, de fato, a tradução em tempo real no Meet é uma das ferramentas mais promissoras que o Google anunciou.

Possivelmente, com a promessa de novos recursos chegando ao Brasil, o Google deve incluir o português quando lançar novos idiomas.

6. NotebookLM para Android

No Google I/O deste ano, o Google lançou a ferramenta do NotebookLM para Android. O assistente de pesquisa personalizado do Google ganhou alguns incrementos no Android graças à integração com o Gemini. No celular, a interface otimizada facilita o uso.

Imagem: Giz Brasil/Screenshot

Também é possível enviar conteúdos de outros apps e organizar esse conteúdo. A versão paga tem mais tokens e integração com o Google Drive.

Com o app, você consegue enviar links de vídeos do YouTube para a ferramenta analisar e transcrever.

Imagem: Giz Brasil/Screenshot

Com a ferramenta, o Google cria um áudio com seus modelos de voz comentando sobre a fonte, que foi um vídeo do YouTube.

Por: Pablo Nogueira