
O dia em que o Google entrou em pânico: A história não contada por trás do ChatGPT
O dia em que o Google entrou em pânico: A história não contada por trás do ChatGPT
Imagine uma gigante tecnológica com mais de US$ 1 trilhão em valor de mercado sendo colocada de joelhos por um pequeno laboratório de pesquisa. Parece roteiro de filme, mas foi exatamente o que aconteceu quando a OpenAI lançou o ChatGPT em dezembro de 2022. De repente, o Google — que há mais de seis anos prometia um “mundo AI-first” — viu-se em desespero, com suas ações despencando e a percepção pública de que havia perdido a dianteira na corrida pela inteligência artificial.
Em 30 de novembro de 2022, a OpenAI — uma empresa até então desconhecida do grande público — liberava o acesso ao ChatGPT, um chatbot de inteligência artificial incrivelmente funcional. Creio que nem os mais otimistas executivos da companhia imaginaram o sucesso que a plataforma teria. Só para você ter uma ideia, em apenas 5 dias, o ChatGPT já tinha alcançado o número de 1 milhão de usuários. Só para efeito de comparação, o Instagram, a maior rede social da atualidade, demorou quase 3 meses para chegar nesse número. Portanto, é compreensível que o Google tenha fica do com o c* na mão ao ver o sucesso estrondoso do ChatGPT.
Em meio a demissões em massa, reuniões de emergência e mudanças drásticas de estratégia, o Google precisou abandonar sua tradicional cautela para tentar recuperar o terreno perdido. Agora você confere essa história em detalhes. Confira como o Google, uma das empresas mais importantes e mais valiosas do mundo, entrou em desespero com o lançamento do ChatGPT!
Você também pode gostar dos artigos abaixo:
Google e OpenAI querem fim das restrições de direitos autorais para treinar IA; entenda o caso
Pessoas estão usando novo modelo de IA do Google para remover marcas d’água de imagens
100 dias para salvar o Google
Quando o ChatGPT foi lançado, o Google declarou estado de emergência. A gigante da tecnologia, que sempre teve tempo e dinheiro de sobra, subitamente se viu acuada, pressionada, exposta. Sissie Hsiao, executiva com 16 anos de casa, recebeu uma missão quase impossível: criar um competidor para o ChatGPT em apenas 100 dias. Era um prazo apertadíssimo, considerando que a empresa normalmente levava meses ou anos para lançar novos produtos.
“Qualidade sobre velocidade, mas rápido” – esse foi o mantra paradoxal que Hsiao estabeleceu para sua equipe. A operação foi montada às pressas. Cerca de 100 funcionários foram retirados à força de outros setores. Gerentes não tiveram escolha: o projeto, batizado de Bard, passava por cima de qualquer outra prioridade. Quem entrava para o time ouvia o mesmo recado: “Você agora é Team Bard. Vista todos os chapéus”.
Enquanto isso, a alta cúpula do Google enfrentava outra realidade difícil. A empresa tinha demitido 12.000 funcionários (7% da força de trabalho) em janeiro de 2023 — os primeiros cortes em massa de sua história. O clima era de insegurança total. “Ninguém sabia exatamente o que fazer para se manter seguro“, relatou um ex-gerente de engenharia à Wired. Se isso significasse perder a hora de colocar os filhos para dormir para participar das reuniões noturnas da equipe Bard, que assim fosse.
Os limites são flexibilizados para ganhar velocidade
Antes de lançar projetos de inteligência artificial, o Google tradicionalmente submetia seus sistemas a rigorosos testes de responsabilidade. Uma equipe especializada passava meses avaliando vieses indesejados e outras deficiências. Com o Bard, esse processo foi encurtado drasticamente.
Um ex-funcionário da equipe de inovação responsável revelou que, quando sinalizações foram levantadas para atrasar o lançamento do Bard, elas foram ignoradas. Os modelos e recursos surgiam rápido demais para que os revisores acompanhassem, mesmo trabalhando noites e fins de semana.
O Bard tinha problemas graves. Os protótipos iniciais caíam em “estereótipos raciais comicamente ruins”, segundo um ex-funcionário. Quando solicitado a fornecer a biografia de alguém com nome indiano, o sistema invariavelmente o descrevia como “ator de Bollywood”. Um nome chinês masculino? “Cientista da computação”.
Essas imprecisões não eram consideradas perigosas — apenas “estúpidas”. Alguns funcionários trocavam capturas de tela das piores respostas por diversão. Um ex-funcionário contou que pediu ao Bard para escrever um rap no estilo Three 6 Mafia sobre jogar baterias de carro no oceano, e o sistema respondeu com detalhes perturbadoramente específicos sobre amarrar pessoas às baterias para que afundassem e morressem — algo completamente fora do contexto da solicitação.
O erro de US$ 100 bilhões
Em fevereiro de 2023, o Google soube que a OpenAI estava prestes a integrar o ChatGPT diretamente ao mecanismo de busca Bing da Microsoft. A gigante de buscas tentou se antecipar ao rival.
No dia 6 de fevereiro, um dia antes do anúncio da Microsoft, Sundar Pichai anunciou que o Bard seria aberto ao público para testes limitados. Em um vídeo promocional, o Bard foi apresentado como um assistente definitivo. No vídeo, um pai perguntava: “Que novas descobertas do Telescópio Espacial James Webb posso contar ao meu filho de 9 anos?” Entre as respostas do Bard: “O JWST tirou as primeiras fotos de um planeta fora do nosso sistema solar”.
Por um momento, parecia que o Google havia recuperado parte de sua glória. Então, a Reuters relatou que o chatbot do Google havia confundido seus telescópios: foi o Very Large Telescope do Observatório Europeu do Sul, localizado no Chile (e não no espaço), que capturou a primeira imagem de um exoplaneta. O incidente foi mais do que constrangedor. As ações da Alphabet caíram 9%, ou cerca de US$ 100 bilhões em valor de mercado.
Para a equipe Bard, a reação ao erro foi um choque. O profissional de marketing que criou a pergunta sobre o telescópio se sentiu responsável. Colegas tentaram animá-lo: executivos, advogados e relações públicas haviam aprovado o exemplo. Ninguém percebeu o erro. E, considerando todos os erros que o ChatGPT estava cometendo, quem esperaria que algo aparentemente tão trivial afundasse as ações?
Hsiao chamou o momento de “um erro inocente”. O Bard havia sido treinado para corroborar suas respostas com base nos resultados da Pesquisa Google e provavelmente interpretou mal um blog da NASA que anunciou a “primeira vez” que astrônomos usaram o telescópio James Webb para fotografar um exoplaneta. Um ex-funcionário se lembra da liderança tranquilizando a equipe de que ninguém perderia a cabeça com o incidente, mas que eles tinham que aprender com isso, e rápido. “Somos o Google, não somos uma startup“, diz Hsiao. “Não podemos dizer tão facilmente: ‘Ah, é só uma falha da tecnologia’. Somos chamados e temos que responder da maneira que o Google precisa responder.”
O segundo golpe: o lançamento do GPT-4
Em março de 2023, o Google mal havia se recuperado do fiasco do Bard quando a OpenAI desferiu outro golpe devastador. O lançamento do GPT-4 escancarou o abismo tecnológico entre as empresas. O novo modelo era muito superior ao LaMDA do Google em tarefas de análise e programação. Vale lembrar que quando o ChatGPT foi aberto ao público, em novembro de 2022, ele usava o modelo GPT-3.5, que ainda tinha muitos problemas e cometia muitos erros e alucinações. O modelo GPT-4 realmente representava um avanço significativo de qualidade.
“Lembro de ficar com o queixo caído e torcer para que o Google acelerasse“, confessou um então engenheiro sênior de pesquisa à Wired. O GPT-4 não apenas escrevia textos com mais nuance, mas também resolvia problemas de matemática complexos, analisava imagens e gerava código funcional.
Uma semana depois, o Google seguiu com o lançamento completo do Bard nos EUA e Reino Unido. Usuários relataram que ele ajudava na redação de e-mails e trabalhos acadêmicos. Mas o ChatGPT já fazia essas tarefas tão bem ou melhor. Por que mudar?
Posteriormente, Pichai reconheceu no podcast Hard Fork que o Google havia levado um “Civic turbinado” para “uma corrida com carros mais potentes”. A empresa precisava de um motor melhor – e rápido.
A fusão que mudou o jogo
Enquanto o Bard enfrentava problemas, o Google trabalhava em uma reorganização massiva nos bastidores. James Manyika, um roboticista formado em Oxford que se tornou consultor da McKinsey para líderes do Vale do Silício, havia se juntado ao Google como vice-presidente sênior de tecnologia e sociedade no início de 2022.
Meses antes do lançamento do ChatGPT, Manyika disse a Pichai que a hesitação do Google em relação à IA não estava servindo bem à empresa. O Google tinha duas equipes de pesquisa de IA de classe mundial operando separadamente e usando poder de computação precioso para objetivos diferentes: o DeepMind em Londres, dirigido por Demis Hassabis, e o Google Brain em Mountain View, parte do escopo de Jeff Dean.
Em abril de 2023, o Google anunciou a fusão das equipes, criando o Google DeepMind (GDM). Hassabis se tornou CEO da nova unidade combinada. Para construir um modelo Gemini o mais rápido possível, alguns funcionários teriam que coordenar seu trabalho em oito fusos horários diferentes. Centenas de salas de chat surgiram. Hassabis, há muito acostumado a jantar com sua família em Londres antes de trabalhar até as 4h da manhã, disse que “cada dia parece quase uma vida inteira quando penso nele”.
O nascimento do Gemini
Em Mountain View, o GDM se mudou para o Gradient Canopy, um novo edifício ultrasseguro em forma de cúpula, ladeado por gramados frescos e seis esculturas inspiradas no Burning Man. O grupo estava no mesmo andar onde Pichai tinha um escritório. Sergey Brin se tornou um visitante frequente, e os gerentes exigiram mais horas presenciais no escritório.
Contrariando as normas da empresa, a maioria dos outros funcionários do Google não tinha permissão para entrar no Gradient Canopy e também não podia acessar códigos-chave de programação do GDM. À medida que o novo projeto absorvia os recursos que o Google podia poupar, pesquisadores de IA que trabalhavam em áreas como saúde e mudanças climáticas lutavam por servidores e perdiam o moral.
O Gemini enfrentou muitos dos mesmos desafios que haviam atormentado o Bard. “Quando você escala as coisas por um fator de 10, tudo quebra”, disse Amin Vahdat, vice-presidente de aprendizado de máquina, sistemas e IA em nuvem do Google. À medida que a data de lançamento se aproximava, Vahdat formou uma war room para solucionar bugs e falhas.
Em dezembro de 2023, quando o Google revelou o Gemini, as ações subiram. O modelo superou o ChatGPT em 30 dos 32 testes padrão. Podia analisar artigos científicos e clipes do YouTube, responder a perguntas sobre matemática e direito. Para funcionários atuais e antigos, isso parecia o início de uma recuperação. Hassabis realizou uma pequena festa no escritório de Londres. “Sou péssimo em comemorações”, lembrou. “Sempre estou pensando na próxima coisa”.
A controvérsia das imagens e o futuro incerto
Um ano após o momento de código vermelho, as perspectivas do Google pareciam melhores. Os investidores haviam se acalmado. Bard e LaMDA ficaram para trás; tanto o aplicativo quanto o modelo de linguagem passariam a ser conhecidos como Gemini. A equipe de Hsiao estava alcançando a OpenAI com um recurso de geração de imagens a partir de texto.
No entanto, quando esse gerador de imagens foi lançado em fevereiro de 2024 como parte do aplicativo Gemini, surgiu um problema inesperado. Quando um usuário solicitava ao Gemini para criar “uma imagem de um senador dos EUA da década de 1800”, ele retornava imagens de mulheres negras, homens asiáticos ou uma mulher nativa americana com um cocar de penas — mas nenhum homem branco. Havia imagens ainda mais perturbadoras, como a representação do Gemini de grupos de soldados alemães da era nazista como pessoas de cor.
Republicanos no Congresso ridicularizaram a “IA woke” do Google. Elon Musk postou repetidamente no X sobre as falhas do Gemini, chamando a IA de “racista e sexista” e destacando um membro da equipe Gemini que ele pensava ser responsável. O funcionário fechou suas contas de mídia social e temeu por sua segurança. O Google interrompeu a capacidade do modelo de gerar imagens de pessoas, e as ações da Alphabet caíram novamente.
O que vem pela frente?
Atualmente, as ações da Alphabet quase dobraram desde seu ponto mais baixo, dias após a estreia do ChatGPT. Hassabis, que recentemente também começou a supervisionar a equipe do aplicativo Gemini de Hsiao, insiste que o ressurgimento da empresa está apenas começando e que saltos incríveis, como a cura de doenças com IA, não estão longe.
No entanto, um desafio persiste: como transformar toda essa pesquisa em lucro? A maioria dos clientes geralmente ainda não está disposta a pagar diretamente por recursos de IA, então a empresa pode estar procurando vender anúncios no aplicativo Gemini.
O medo de mais demissões, mais esgotamento e mais problemas legais é grande entre funcionários atuais e ex-funcionários. Um pesquisador do Google e um colega de alto escalão dizem que o sentimento predominante é de desconforto. A IA generativa é claramente útil. Até governos propensos a regular as big techs, como a França, estão se aproximando das promessas da tecnologia.
Dentro do Google DeepMind e durante palestras públicas, Hassabis não cedeu um centímetro de seu objetivo de criar inteligência artificial geral, um sistema capaz de cognição em nível humano em uma variedade de tarefas.
Enquanto isso, a OpenAI continua avançando, com seu serviço Operator, uma IA “agêntica” que pode agir muito além da janela do chatbot — clicando e digitando em sites como uma pessoa faria para executar tarefas como reservar uma viagem ou preencher um formulário.
O Google, naturalmente, está trabalhando para trazer recursos semelhantes para seus próximos modelos. Onde o Gemini atual pode ajudá-lo a desenvolver um plano de refeições, o próximo colocará seus ingredientes em um carrinho de compras online. Talvez o seguinte lhe dê feedback em tempo real sobre sua técnica de cortar cebolas.
Como sempre, mover-se rapidamente pode significar errar com frequência. A corrida pela dominância da IA continua, e o Google parece determinado a nunca mais ser pego desprevenido.
Você acha que o Google conseguirá recuperar sua posição de liderança na corrida da inteligência artificial, ou a OpenAI veio para ficar no topo? Compartilhe sua opinião nos comentários e não se esqueça de conferir nossos outros artigos sobre o futuro da tecnologia!
Fonte: Wired
Leave A Comment
You must be logged in to post a comment.