En el marco del Google I/O 2024, Sundar Pichai (CEO de Google) ha dejado claro que no estamos ante una simple actualización, sino ante el inicio de una nueva era multimodal. De hecho, la frontera entre el cine y la realidad se ha desvanecido. 

Si hace una década la película “Her” nos parecía un futuro distópico, la presentación de Project Astra y GPT-4o ha confirmado que Samantha ya no es solo un personaje de voz cálida interpretado por Scarlett Johansson: es el nuevo estándar de la Inteligencia Artificial.

Pichai, el CEO de Google, recuerda con nostalgia cuando se «enamoró» de la IA al ver a una red neuronal reconocer la foto de un gato. 

Actualmente, esa fascinación se ha transformado en Gemini, un ecosistema que busca ser el copiloto definitivo de nuestra vida digital. Las 3 claves del nuevo ecosistema Google:

Multimodalidad Nativa

Distinto a los modelos anteriores, Project Astra fue diseñado para entender texto, voz y vídeo en tiempo real. Es una visión que tuvimos desde el principio, afirma Pichai.

Contexto Infinito

Con ventanas de contexto de hasta 2 millones de tokens, la IA no solo te escucha, sino que recuerda conversaciones masivas, lo que permite interacciones mucho más humanas y profundas.

Agentes Proactivos

El objetivo es que Gemini deje de ser un buscador para ser un ejecutor: planificar viajes en segundo plano o gestionar proyectos complejos en Chrome.

Quizás uno de los momentos más disruptivos fue la demostración de Astra funcionando a través de unas gafas. Aunque el smartphone sigue siendo el rey, Pichai apuesta por un ecosistema de gafas de realidad aumentada.

Por lo pronto, la IA se aprovecha realmente en un tipo gafas, por ello el objetivo de Google es invertir en este ecosistema próximamente.

¿Qué plantea esto? Un cambio de paradigma: pasar de mirar una pantalla a interactuar con el mundo físico asistido por una capa de inteligencia constante.

La realidad es que surgen preguntas inevitables producto de la capacidad que tiene la IA para clonar voces y generar vínculos emocionales. Pichai, aunque bromea sobre su propia vida personal, reconoce que la tecnología debe ser responsable.

No obstante, Google extenderá su herramienta SynthID (marcas de agua digitales) no solo a imágenes, sino también a voz y vídeo para combatir la desinformación.

Por otro lado, la detección de estafas telefónicas en tiempo real se ejecutarán de forma local gracias a Gemini Nano, asegurando que los datos no salgan del dispositivo.

En conclusión, para Pichai se está frente a la tecnología más trascendental de la humanidad. Google ya no es solo un buscador; es una compañía Gemini-first. 

¿La meta? Es clara: integrar esta inteligencia en la vida diaria de miles de millones de personas, transformando cada smartphone en un asistente con el que, finalmente, podremos hablar de tú a tú.

Otros artículos interesantes: 

(S.M.C)

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)