YouTube testa sincronização labial com IA para traduzir vídeos em tempo real
YouTube testa sincronização labial com IA para traduzir vídeos em tempo real
O Youtube está experimentando uma tecnologia que ajusta digitalmente o movimento dos lábios dos criadores para corresponder ao áudio dublado em diferentes idiomas. O recurso promete eliminar um dos maiores problemas da dublagem automática: a sensação desconfortável de assistir alguém falar com a boca descasada do som.
Como funciona a tecnologia
O sistema desenvolvido pelo YouTube opera através de modificações pixel a pixel no vídeo original. Segundo Buddhika Kottahachchi, chefe de produto de dublagem da plataforma, a tecnologia utiliza inteligência artificial customizada que compreende a geometria tridimensional do rosto humano. O modelo consegue mapear lábios, dentes e até expressões faciais que acompanham a fala, criando sincronização convincente entre imagem e áudio traduzido.
Limitações técnicas atuais
O recurso enfrenta restrições importantes em sua fase de testes. A sincronização labial funciona apenas com vídeos em resolução Full HD (1080p), perdendo eficácia em conteúdo 4K. O projeto piloto suporta inicialmente inglês, francês, alemão, português e espanhol, com planos de expansão para mais de 20 idiomas futuramente.
Impacto nos criadores
Desde dezembro de 2024, mais de 60 milhões de vídeos já foram dublados automaticamente em 20 idiomas diferentes. Os dados da plataforma revelam que espectadores assistiram mais de 75% do tempo médio de visualização em versões dubladas, comparado aos vídeos originais. Criadores que adotaram áudio multilíngue registraram mais de 25% do tempo de exibição vindo de visualizações em idiomas secundários
Expansão global do recurso
A dublagem automática foi liberada para 80 milhões de criadores em junho de 2025, provocando reações mistas da comunidade. Alguns criadores criticaram a qualidade “robótica” das primeiras versões, demandando acesso a ferramentas de controle manual. O chef Jamie Oliver triplicou suas visualizações após implementar áudio multilíngue, enquanto Mark Rober chegou a carregar 30 faixas de idioma por vídeo.
O futuro da dublagem automatizada
O YouTube ainda não definiu data oficial para liberação ampla da sincronização labial. A empresa avalia restrições computacionais e qualidade do output antes de escalar o recurso para toda a base de criadores. A tecnologia representa o próximo passo natural após o lançamento do áudio multilíngue para toda a plataforma em setembro de 2025.
Você também deve ler!
Brasileiros assistem mais YouTube na TV do que no celular, revela pesquisa
Leave A Comment
You must be logged in to post a comment.