O Projeto Astra roubou a cena no Google I/Odando-nos uma ideia de como serão nossas interações com o mundo Gêmeos 1,5 – Modelo de IA de próxima geração do Google. Embora possa levar algum tempo até que o lançamento geral do Projeto Astra seja lançado para dispositivos, tive a oportunidade de mostrar seus vários recursos enquanto participava da conferência anual de desenvolvedores do Google.
Resumindo, o Projeto Astra é uma IA baseada em câmera em tempo real que pode fazer qualquer coisa, desde identificar um objeto no quadro até criar uma história fictícia em torno desse objeto, até reescrever essa história usando uma quantidade desagradável de aliterações. Não, sério, quando questionados sobre uma maçã de plástico, eles romantizam o brinquedo (presumivelmente tirado de um conjunto infantil) como um “produto lindo e perfeitamente colocado”.
@tomsguide
♬ som original – Guia do Tom
Para fins de demonstração, o Google conectou uma câmera fixa de cima para baixo a um dispositivo rodando Gemini 1.5. Somente a imagem da câmera foi utilizada neste jogo de anagramas, embora também mostrasse os elementos de identificação do objeto do modelo. Ao ser apresentado a um grupo de estatuetas de dinossauros, Gêmeos não apenas nomeou a categoria de cada uma, mas também apresentou nomes e histórias de aventura que pareciam surpreendentemente apropriadas.
Diante de um desafio menos especulativo, um repórter pediu ao cliente que lesse a tatuagem relativamente pequena impressa em seu antebraço e indicasse o programa de TV ao qual ela fazia referência. Embora Grilo inicialmente tenha adivinhado “Game of Thrones” errado, ele pousou em “Battlestar Galactica” na segunda tentativa. (Caso você esteja se perguntando, a citação era “É o que todos dizemos”).
O Google também tinha um modelo Gemini com tela sensível ao toque, pronto para rodadas amigáveis de Pictionary. Aceitei o desafio do Projeto Astra e apresentei minha melhor tentativa de criar um certo robô em forma de bola Guerra das Estrelas universo para ficar com o tema da ficção científica. Embora esse doodle certamente não merecesse um lugar na geladeira, quando perguntado “O que você vê?” O agente acertou em cheio – BB-8 da trilogia sequencial.
Embora a demonstração tenha caráter de teste, a ideia é que ela prove o quão útil o Gemini pode ser com suas habilidades visuais. O Google disse que inicialmente chegará aos telefones Android na forma de Gemini Live, mas… Este é o vídeo de demonstração oficial É mostrado que ele está funcionando usando um “dispositivo de prototipagem de óculos”, sugerindo que um novo formato está em desenvolvimento.
Em um cenário ideal, o Gemini Live será capaz de ver o que você vê para responder perguntas, inspirar criatividade ou até mesmo ajudá-lo a encontrar algo que está faltando escondido à vista de todos. Fazer isso por meio do aplicativo Gemini ou do aplicativo de câmera de um smartphone faz bastante sentido, mas acho que o design dos óculos é como… Óculos inteligentes Ray-Ban Meta Ele era Em última análise, fornece menos atrito.
Como um instrumento do estilo “olhar e contar”, o Projeto Astra e o Gemini parecem estar à altura do hype. Existem versões concorrentes de ambos disponíveis agora, mas se há uma empresa que sabe fazer pesquisas corretamente, essa empresa é o Google.