Clique e Assine VEJA por R$ 9,90/mês
Continua após publicidade

OpenAI anuncia versão gratuita do ChatGPT com interações por imagem e voz

O objetivo é criar uma interação humano-computador mais natural, segundo a empresa

Por Marília Monitchele Materia seguir SEGUIR Materia seguir SEGUINDO Atualizado em 13 Maio 2024, 16h20 - Publicado em 13 Maio 2024, 16h13

Nesta segunda-feira, 13, a OpenAI anunciou o GPT-4o (com a letra “o” de “Omni”, que significa “para todos” em latim), seu novo modelo principal de inteligência artificial. Esse modelo traz recursos avançados, incluindo a capacidade de processar imagens e vozes em tempo real. As atualizações estão sendo disponibilizadas gradualmente para os usuários das versões pagas do ChatGPT Plus e Team, com a expectativa de que os usuários das versões gratuitas também tenham acesso às  novidades nas próximas semanas, conforme afirmou Sam Altman, CEO da OpenAI.

Com o GPT-4o, a ferramenta torna-se capaz de interagir em tempo real, inclusive com recursos de fala e imagem que permitem a escuta de áudios e a “leitura” de fotos e vídeos durante as interações. Em uma demonstração, um executivo solicitou conselhos ao chatBot para se acalmar antes de uma apresentação importante. O assistente de voz recém-implementado analisou a respiração e ofereceu técnicas de controle. Outra demonstração apresentou o ChatGPT lendo uma história gerada por IA em diferentes entonações, desde recitais dramáticos, tons robóticos e até mesmo canto. Em uma terceira demonstração, um usuário apontou a câmera do celular para uma equação e solicitou que a IA a analisasse, auxiliando na resolução em vez de simplesmente fornecer a resposta. Em todos os testes, o GPT-4o demonstrou personalidade e habilidades de conversação mais complexas em comparação com as versões anteriores, além de respostas mais rápidas e a possibilidade de interromper a interação humano-robô. 

A empresa também demonstrou os recursos funcionando simultaneamente em diferentes idiomas, destacando os recursos multimodais em interações visuais, de áudio e de texto, com o assistente de IA capaz de usar a câmera de um telefone para ler notas escritas e tentar detectar a emoção de uma pessoa.

Essas novidades foram apresentadas às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira em Mountain View, Califórnia. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Microsoft e Apple também estão reorganizando suas ofertas em torno de um futuro baseado em IA generativa, e a OpenAI, cujo ChatGPT deu início à corrida, está tentando manter sua liderança.

Publicidade

Matéria exclusiva para assinantes. Faça seu login

Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

Domine o fato. Confie na fonte.

10 grandes marcas em uma única assinatura digital

MELHOR
OFERTA

Digital Completo
Digital Completo

Acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

a partir de 9,90/mês*

ou
Impressa + Digital
Impressa + Digital

Receba Veja impressa e tenha acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

a partir de 49,90/mês

*Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
*Pagamento único anual de R$118,80, equivalente a 9,90/mês.

PARABÉNS! Você já pode ler essa matéria grátis.
Fechar

Não vá embora sem ler essa matéria!
Assista um anúncio e leia grátis
CLIQUE AQUI.