Clique e Assine VEJA por R$ 9,90/mês
Continua após publicidade

OpenAI anuncia versão gratuita do ChatGPT com interações por imagem e voz

O objetivo é criar uma interação humano-computador mais natural, segundo a empresa

Por Marília Monitchele Materia seguir SEGUIR Materia seguir SEGUINDO Atualizado em 13 Maio 2024, 16h20 - Publicado em 13 Maio 2024, 16h13
  • Seguir materia Seguindo materia
  • Nesta segunda-feira, 13, a OpenAI anunciou o GPT-4o (com a letra “o” de “Omni”, que significa “para todos” em latim), seu novo modelo principal de inteligência artificial. Esse modelo traz recursos avançados, incluindo a capacidade de processar imagens e vozes em tempo real. As atualizações estão sendo disponibilizadas gradualmente para os usuários das versões pagas do ChatGPT Plus e Team, com a expectativa de que os usuários das versões gratuitas também tenham acesso às  novidades nas próximas semanas, conforme afirmou Sam Altman, CEO da OpenAI.

    Publicidade

    Com o GPT-4o, a ferramenta torna-se capaz de interagir em tempo real, inclusive com recursos de fala e imagem que permitem a escuta de áudios e a “leitura” de fotos e vídeos durante as interações. Em uma demonstração, um executivo solicitou conselhos ao chatBot para se acalmar antes de uma apresentação importante. O assistente de voz recém-implementado analisou a respiração e ofereceu técnicas de controle. Outra demonstração apresentou o ChatGPT lendo uma história gerada por IA em diferentes entonações, desde recitais dramáticos, tons robóticos e até mesmo canto. Em uma terceira demonstração, um usuário apontou a câmera do celular para uma equação e solicitou que a IA a analisasse, auxiliando na resolução em vez de simplesmente fornecer a resposta. Em todos os testes, o GPT-4o demonstrou personalidade e habilidades de conversação mais complexas em comparação com as versões anteriores, além de respostas mais rápidas e a possibilidade de interromper a interação humano-robô. 

    Publicidade

    A empresa também demonstrou os recursos funcionando simultaneamente em diferentes idiomas, destacando os recursos multimodais em interações visuais, de áudio e de texto, com o assistente de IA capaz de usar a câmera de um telefone para ler notas escritas e tentar detectar a emoção de uma pessoa.

    Essas novidades foram apresentadas às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira em Mountain View, Califórnia. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Microsoft e Apple também estão reorganizando suas ofertas em torno de um futuro baseado em IA generativa, e a OpenAI, cujo ChatGPT deu início à corrida, está tentando manter sua liderança.

    Publicidade

    Publicidade

    Matéria exclusiva para assinantes. Faça seu login

    Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

    Domine o fato. Confie na fonte.

    10 grandes marcas em uma única assinatura digital

    MELHOR
    OFERTA

    Digital Completo
    Digital Completo

    Acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

    a partir de 9,90/mês*

    ou
    Impressa + Digital
    Impressa + Digital

    Receba Veja impressa e tenha acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

    a partir de 49,90/mês

    *Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
    *Pagamento único anual de R$118,80, equivalente a 9,90/mês.

    PARABÉNS! Você já pode ler essa matéria grátis.
    Fechar

    Não vá embora sem ler essa matéria!
    Assista um anúncio e leia grátis
    CLIQUE AQUI.