Todas las claves de Gemini, la nueva herramienta de IA: "Supera el rendimiento de expertos humanos"

Carlos Fenollosa es divulgador y CEO de Optimus Price y ha pasado por los micrófonos de 'Mediodía COPE' para explicar pormenorizadamente este sistema

Paola Albaladejo

Publicado el - Actualizado

2 min lectura

De momento, estamos subiendo hoy un nuevo escalón con la llegada de un sistema del que todo el mundo habla.

Es Gemini. "Es nuestro modelo más grande y más capaz. Puede comprender el mundo que nos rodea de la misma manera que nosotros. Así que no es solamente texto. Mezcla código, audio, imagen y vídeo", cuenta el CEO de Google.

Podremos decir que, siguiendo esta explicación, la principal novedad del sistema es que funciona como si tuviera ojo pero oído. Puede interpretar imágenes y sonido. Lo más destacado es que saca conclusiones. Da respuestas por sí mismo.

Con este sistema, se le ocurría a Sofía Buera que, quizás, puedes ver la nevera y te podría sugerir qué receta hacer.

"Tiene capacidad de interactuar a través de una imagen"

Carlos Fenollosa es divulgador, investigador en inteligencia artificial y Ceo de Optimus Price. Ha contado en los micrófonos de 'Mediodía COPE' que "nadie ha podido probar este sistema. Google ha lanzado varios modelos. Uno más pequeño y una versión más sobredimensionada para ejecutarse en los centros de cálculo. La versión intermedia, que sería equivalente a ChatGPT, la van a empezar a publicar en una herramienta en los próximos días".

Pero, de momento, solamente podemos hablar "en base a vídeos y notas de prensa que hemos visto".

¿Y por qué supera a Chat GPT? "Google explica que es el primer modelo de IA que supera el rendimiento de expertos humanos. Los resultados son impresionantes. Sacan un 9 sobre 10 en preguntas que son niveles de universidad".

Para Fenollosa, la capacidad que tiene de visualizar e interactuar "es lo más espectacular" porque "es un sistema multimodal que es la capacidad que tiene IA de interactuar a través de una imagen".

Gemini 1.0 se está implementando en diferentes productos y plataformas de Google, entre las que se encuentra Bard, que utilizará a partir de ahora una versión mejorada de Gemini pro para un razonamiento, planificación y comprensión más avanzados.

Asimismo, esta tecnología llegará a Pixel -más concretamente, a Pixel 8 Pro, con la versión Gemini Nano- para impulsar funcionces como la de 'Resumir' en la aplicación Grabadora y la implementación e 'Respuesta inteligente' en Gboard.

En los próximos meses, Gemini estará disponible en servicios de Google como Búsqueda, Anuncios, Chrome y Duet AI y también se está probamdo para que la Experiencia Generativa de Búsqueda (SGE) sea más rápida para los usuarios.

A partir del 13 de diciembre, los desarrolladores también podrán acceder a Gemini Pro a través de la API de Gemini en Goole AI Studio o Google Cloud Vertex AI.