No evento Google Cloud Next 2025, realizado em Las Vegas na terça-feira, 15, o Google anunciou a adição do Veo 2 à plataforma Gemini, uma melhoria que permite ao chatbot de IA gerar vídeos curtos, de oito segundos, em formato MP4 e qualidade 720p.
O Whisk, a experiência do Google Labs na criação de imagens através de texto, é agora capaz de as animar com resultados mais realistas. Com este lançamento, a empresa procura acelerar a produção de conteúdos audiovisuais e expandir as possibilidades criativas dos utilizadores sem necessidade de ferramentas profissionais.
A proposta oferece uma forma de partilhar rapidamente os resultados em dispositivos móveis, integrando-se com serviços populares de conteúdos audiovisuais. Além disso, foi estabelecido um limite mensal para o número de vídeos que podem ser gerados, com notificações que alertam os utilizadores quando se aproximam do limite máximo permitido.
Novas capacidades de vídeo no Gemini
O Veo 2 centra-se no movimento fluido e na recriação de cenas variadas, integrando uma interpretação pormenorizada da física real. O sistema foi concebido para refletir com maior precisão o comportamento humano e ambiental, produzindo resultados que se aproximam do realismo cinematográfico.
Os subscritores do Gemini Advanced podem descrever a cena que pretendem capturar, quer se trate de uma história curta, de um conceito visual ou de uma ideia específica. Quanto mais informações incluírem, mais controlo podem exercer sobre o resultado final. Com esta funcionalidade, a Google pretende simplificar o processo de criação, de modo a que não seja necessário qualquer software especializado ou experiência prévia em edição.
Whisk Animate: imagens transformadas em clips
O Whisk é uma plataforma de experimentação que utiliza modelos de inteligência artificial para materializar ideias com base em descrições escritas ou referências visuais. Desde este mês, os utilizadores do Google One AI Premium podem utilizar o Whisk Animate, uma extensão capaz de gerar vídeos de oito segundos a partir de imagens produzidas na própria ferramenta. A integração do Veo 2 permite a criação de sequências animadas a partir de material estático, com um nível de pormenor concebido para diferentes estilos estéticos.
Estas inovações estão disponíveis a nível mundial e em todas as línguas suportadas pelo Gemini. O Google Labs reforça o ecossistema de criação de conteúdos, proporcionando aos criadores casuais e aos profissionais uma forma rápida e acessível de desenvolver projetos audiovisuais.
Segurança e controlo de conteúdos
O compromisso da empresa com a segurança na geração de vídeos inclui a pré-avaliação e a prevenção de utilizações inadequadas e violações de políticas. Para identificar os vídeos gerados, cada fotograma inclui um marcador chamado SynthID (um identificador para imagens ou vídeos gerados por IA desenvolvido pela Google DeepMind, que não é visível a olho nu), para que a sua origem sintética possa ser detetada se for partilhada em diferentes plataformas.
Além disso, o modelo avalia os textos recebidos como entrada, embora reconheça que o conteúdo final depende em grande medida das indicações fornecidas pelo utilizador. A Google convida à apresentação de comentários através da ferramenta de feedback incluída nas aplicações, com o objetivo de aperfeiçoar a moderação e corrigir possíveis desvios na geração de conteúdos.
Quem quiser explorar estas novas funcionalidades pode aceder ao Gemini e ao Whisk a partir de aplicações Web ou de dispositivos móveis. Ao fazê-lo, a Google está a impulsionar a criatividade da inteligência artificial e a expandir as possibilidades de produção de vídeos curtos em diferentes áreas.