Super Mensajes

Luego de ocho años de investigaciones, Google revela que ha logrado trabajar en su modelo de inteligencia artificial más potente para tareas complejas. Se trata de Gemini, modelo IA que ha logrado superar a los humanos en comprensión del lenguaje multitarea. Descubre sus funciones.


Sundar Pichai, director ejecutivo de Google y Alphabet, señaló en un comunicado que el modelo de inteligencia artificial Gemini 1.0, está optimizado para diferentes tamaños: Ultra, Pro y Nano. 

"Estos son los primeros modelos de la era Gemini y la primera realización de la visión que tuvimos cuando formamos Google DeepMind a principios de este año. Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa. Estoy realmente emocionado por lo que está por venir y por las oportunidades que Gemini desbloqueará para personas de todo el mundo", dijo.

Por su parte, Demis Hassabis, CEO y co-fundador de Google DeepMind, confesó que el objetivo era trabajar en modelos de inteligencia artificial, inspirados en la forma en que las personas entienden el mundo e interactúan con él. 

"La IA se sentiría menos como una pieza de software inteligente y aún más útil e intuitiva: un colaborador o compañero experto", sostuvo. 

Gemini ha sido titulado como el modelo de inteligencia artificial más capaz y generalista que jamás Google haya construido. 

La versión Gemini 1.0 se divide en Gemini Ultra, el  modelo más grande y con mayor capacidad para tareas altamente complejas; Gemini Pro, un modelo para escalar en una amplia gama de tareas; y Gemini Nan, el modelo más eficiente para tareas en el dispositivo.

Con una puntuación del 90,0%, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea, por sus siglas en inglés),que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar tanto el conocimiento del mundo como su capacidad de resolución de problemas.


¿Cómo funciona Gemini?

Fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar diferentes tipos de información, incluidos texto, imágenes, audio, video y código.

Es capaz de ejecutarse de manera eficiente desde en centros de datos hasta en dispositivos móviles. Sus capacidades de vanguardia mejorarán significativamente la forma en que los desarrolladores y clientes empresariales construyen y escalan con IA.

A partir de hoy, Bard utilizará una versión refinada de Gemini Pro que le permitirá comprender y resumir, razonar, generar ideas, escribir y planificar mucho mejor. Esta actualización estará disponible en inglés en más de 170 países y territorios, y en los próximos meses en más idiomas.

Gemini 1.0 fue capacitado para reconocer y comprender texto, imágenes, audio y más al mismo tiempo, por lo que comprende mejor la información matizada y puede responder preguntas relacionadas con temas complicados. Esto lo hace especialmente bueno para explicar el razonamiento en matemáticas y física.

El modelo IA Gemini puede comprender, explicar y generar código de alta calidad en los lenguajes de programación más populares del mundo como Python, Java, C++ y Go. Su capacidad para trabajar en varios idiomas y razonar sobre información compleja lo convierte en uno de los modelos básicos de codificación líderes en el mundo.

Gemini también se puede utilizar como motor para sistemas más avanzados. Hace dos años, Google lanzó AlphaCode, el primer sistema de generación de código con IA que alcanza un nivel competitivo de rendimiento en competiciones de programación.

"Utilizando una versión especializada de Gemini, creamos un sistema de generación de código más avanzado, AlphaCode 2, que se destaca en la resolución de problemas de programación competitivos que van más allá del código e involucran matemáticas complejas e informática teórica", agregó. Es así que AlphaCode 2 muestra mejoras masivas, resolviendo casi el doble de problemas. Y funciona mejor que el 85% de los participantes de la competencia, en comparación con casi el 50 % de AlphaCode. 

Pero, ¿los usuarios podrán usar Gemini? En los próximos meses, Gemini estará disponible en Chrome, los Anuncios y Duet AI, así como en las búsquedas generativas, en las cuales ya se hacen pruebas.


Revisa más noticias sobre ciencia, tecnología e innovación en la Agencia Andina y escucha historias inspiradoras en Andina Podcast.

Más en Andina:
(FIN) NDP/SPV
Publicado: 6/12/2023