Google ha celebrado este martes una nueva edición de su evento anual de desarrolladores Google I/O, en el que se ha constatado que Gemini es su camino hacia la inteligencia artificial general, esto es, una IA responsable que sea útil para las personas en su día a día.
Actualmente, la familia de modelos Gemini impulsa las principales funciones de IA de los servicios de la compañía. Gemini 1.5 Pro, con su ventana de contexto de hasta un millón de tokens, ofrece un razonamiento, planificación y comprensión más avanzados.
Gemini 1.5 Pro está disponible desde este martes para todos los desarrolladores a nivel global, y dentro de la suscripción Gemini Advanced, ampliará su ventana de contexto a 2 millones de tokens a finales de año, estando primero disponible para desarrolladores con una vista previa privada.
De la mano de Google DeepMind, la familia de modelos crece con una nueva incorporación: Gemini 1.5 Flash, una versión más ligera que Pro optimizada para tareas comunes como resumen o traducción, que puede probarse en Google AI studio y Vertex AI con un millón de tokens.
Gemini también impulsa los agentes, unos sistemas inteligentes que muestran capacidad de razonamiento, planificación y memoria para ayudar al usuario en una amplia variedad de tareas, con el apoyo de servicios de Google como Gmail o Chrome.
Asimismo, ha actualizado las herramientas de IA generativa que se enmarcan bajo Generative Media, dedicadas a la creación de imágenes, música y vídeos, y en las que ha trabajado en los últimos meses.
Imagen 3, en pruebas en Labs, ofrece ahora un resultado más fotorrealista, ya que crea imágenes con gran detalle y calidad a partir de descripciones que el usuario puede completar con todo los matices que quiera añadir.
Music AI Sandbox, por su parte, ofrece un conjunto de herramientas de IA para la creación de canciones de calidad profesional, mientras que Veo genera vídeo en alta calidad (1080p) a partir de texto, imágenes y propuestas de vídeo, e incorporar efectos con la función experimental VideoFx.
Google DeepMind también ha anticipado Project Astra, lo que la compañía espera que en un futuro sea un verdadero asistente universal. En la demostración que se ha compartido, la compañía ha apuntado que es un asistente multimodal construido a partir de Gemini que ve el mundo a través de la cámara del 'smartphone' para que el usuario pueda preguntar sobre él.
Tu opinión enriquece este artículo: