Fim do Photoshop? ChatGPT agora gera imagens mais realista e com texto legível

Fim do Photoshop? ChatGPT agora gera imagens mais realista e com texto legível

A OpenAI anunciou nesta terça-feira (25) a integração do Sora ao ChatGPT, aprimorando significativamente a geração de imagens na plataforma. O novo sistema, baseado no modelo GPT-4o, resolve um dos maiores problemas das ferramentas de inteligência artificial: a renderização de textos legíveis dentro das imagens criadas. Por mais competente que fosse o algoritmo para geração de imagens, a inserção de texto legível sempre foi um problema. Mesmo os modelos mais avançados sofrem com isso. Agora não mais.

Antes disponível apenas em um site separado, a funcionalidade agora faz parte do ChatGPT sob o nome “Imagens no ChatGPT”. Segundo Gabriel Goh, líder de pesquisa da OpenAI, o sistema traz avanços significativos na precisão dos detalhes, especialmente na capacidade de manter relações corretas entre atributos e objetos.

Você também pode gostar dos artigos abaixo:

Google e OpenAI querem fim das restrições de direitos autorais para treinar IA; entenda o caso

Pessoas estão usando novo modelo de IA do Google para remover marcas d’água de imagens

O modelo utiliza um conceito chamado “binding”, que permite gerar imagens com maior precisão ao solicitar múltiplos elementos. A melhoria na renderização de textos exigiu meses de refinamento, com falhas ocorrendo apenas em textos muito pequenos ou caracteres não latinos.

Diferente do DALL-E e outras ferramentas que usam método baseado em difusão, o Sora emprega um processo autoregressivo, criando a imagem sequencialmente, da esquerda para a direita e de cima para baixo. Essa abordagem é provavelmente responsável pela maior precisão nas imagens.

Jackie Shannon, líder de produto multimodal da OpenAI, destacou que o diferencial da IA do ChatGPT é seu conhecimento de mundo. Isso significa que o usuário não precisa fornecer detalhes extensivos sobre um conceito para obter uma imagem precisa.

chatgpt

Entre as aplicações demonstradas estão diagramas científicos, histórias em quadrinhos com balões de diálogo consistentes, pôsteres informativos, imagens com fundo transparente para adesivos, cardápios e logotipos. Embora leve mais tempo para gerar imagens comparado a versões anteriores, a OpenAI considera que a qualidade compensa a espera.

chatgpt

A nova funcionalidade está disponível para usuários dos planos ChatGPT Plus, Pro, Team e Free, com limites de uso similares ao DALL-E para o plano gratuito. Todas as imagens geradas incluem metadados C2PA, um padrão adotado para identificar criações de IA, mesmo sem marcas d’água visíveis.

A OpenAI reforçou ainda seus mecanismos de segurança, bloqueando a criação de deepfakes sexuais, remoção de marcas d’água e conteúdo ilegal. Os usuários mantêm a propriedade das imagens geradas, podendo utilizá-las conforme as políticas da empresa.

O que você acha dessa evolução nos geradores de imagem? Conte nos comentários como pretende usar essa nova funcionalidade!

Leave A Comment

You must be logged in to post a comment.

Back to Top