Este miércoles, Google lanzó el modelo de inteligencia Artificial más avanzado que ha desarrollado hasta la fecha: Gemini (1.0), la primera versión que viene en tres tamaños para diferentes aplicaciones.

Gemini es un modelo de Inteligencia Artificial (IA) multimodal, lo que significa que puede generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación.

También es el modelo más flexible hasta el momento, capaz de ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos.

Gemini mejorará significativamente la forma en la que los clientes corporativos y desarrolladores construyen y escalan con IA.

Los tres niveles de uso de esta iniciativa son:

La compañía diseñó Gemini para que fuera un modelo de IA multimodal de forma nativa, es decir, previamente entrenado en diferentes modalidades (y desde el inicio).

Se perfeccionó con datos multimodales adicionales para poder mejorar su eficacia. Esto ayuda a Gemini a comprender y razonar sin problemas todo tipo de entradas desde el principio, mucho mejor que los modelos multimodales existentes, y sus capacidades son de vanguardia en casi todos los ámbitos.

Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:

