OpenAI superou a Apple Durante a transmissão ao vivo do Spring Update na noite passada. Isso ocorreu em termos de entusiasmo pré-evento e da reação extremamente positiva aos produtos anunciados pela equipe. Como disse o CEO Sam Altman: “Parece mágica”.
O maior anúncio foi o modelo GTB-4o Qual irá alimentar Bate-papoGPT Para usuários pagos e gratuitos. Ao contrário dos modelos de linguagem grande, este é um modelo multimídia, capaz de acomodar qualquer coisa, desde texto a vídeo, fala e saída de texto e até arquivos 3D.
Costumávamos falar sobre o momento do iPhone em que Steve Jobs mudou a indústria móvel para sempre, e então, em novembro de 2022, começamos a falar sobre Bate-papoGPT Momento. Este foi outro produto que definiu a indústria, eu acho OpenAI Ele fez isso de novo.
Cobri muitos anúncios de produtos ao longo dos meus mais de 20 anos no negócio e esta é a coisa mais emocionante que já fiz para experimentar um novo produto. Se quisermos acreditar em Altman, esse é o caso Apenas o começo.
Por que o GPT-4o é importante?
GPT-4o (ou Modelo Omni) oferece uma nova forma de interagir com a informação. Em vez de digitar, você pode simplesmente bater um papo ou assistir a um vídeo e obter uma resposta de voz sem demora.
Esta resposta não será a ligeiramente monótona de outros auxiliares ou as falsas inflexões da geração anterior Bate-papo por voz GPT – É uma voz natural com riso, emoção e inflexões que reagem em tempo real à sua conversa.
Recursos completos de multimídia com a capacidade de conversar naturalmente usando fala para fala ainda estão sendo implementados lentamente, mas mesmo a versão de bate-papo – falando em texto e imagens – é mais rápida e responsiva do que suas antecessoras.
Altman ele escreveu em seu blog: “Conversar com um computador nunca foi algo natural para mim; agora é algo que adicionamos personalização (opcional), acesso às suas informações, a capacidade de realizar ações em seu nome e muito mais, posso realmente ver um futuro emocionante onde. podemos usar computadores para fazer mais do que qualquer coisa.”
Como poderia ser esse futuro?
Um dia, e talvez não tão longe como muitas pessoas pensam, esta tecnologia irá alimentar robôs que trabalham connosco ou nos servem nas nossas casas.
Serão robôs com quem poderemos conversar como amigos e pedir-lhes que realizem tarefas complexas e fazer com que as compreendam e respondam.
Alguém vai se apaixonar pelo GPT-4o.
Mesmo no curto prazo, com a introdução do OpenAI IPADE com os aplicativos para iPhone e laptop do ChatGPT com recursos de áudio e visão, veremos ela assumir o papel de professora, assistente de programação, consultora financeira e preparadora física – e fazê-lo sem julgamento.
O que estamos a testemunhar agora – e outras empresas o seguirão – é o alvorecer de uma nova era na tecnologia de interface homem-computador.
Os modelos Omni não exigem que a IA primeiro converta o que você diz em texto, depois analise o texto e depois converta-o novamente em fala – eles entendem o que estamos dizendo nativamente, analisando o áudio, as inflexões de nossa voz e até mesmo o vídeo ao vivo alimenta.
O pequeno ponto preto com o qual você está falando e que lhe responde representa uma mudança de paradigma tão grande no acesso à informação quanto a primeira impressora, a máquina de escrever, o computador pessoal, a Internet ou mesmo o smartphone.