Meta Platforms publicó el jueves las primeras versiones de su último gran modelo lingüístico, Llama 3, y de un generador de imágenes que actualiza las imágenes en tiempo real mientras los usuarios teclean las instrucciones, en su carrera por alcanzar al líder del mercado de IA generativa, OpenAI.

Los modelos se integrarán en su asistente virtual Meta AI, que la empresa está presentando como el más sofisticado de sus homólogos de uso gratuito, citando comparaciones de rendimiento en temas como el razonamiento, la codificación y la escritura creativa frente a ofertas de rivales como Google, de Alphabet, y la startup francesa Mistral AI.

El asistente actualizado de Meta AI tendrá más protagonismo en las aplicaciones de Facebook, Instagram, WhatsApp y Messenger de Meta, así como en un nuevo sitio web independiente que lo posiciona para competir más directamente con el éxito de OpenAI, respaldado por Microsoft, ChatGPT.

Una página de aterrizaje que recibe a los visitantes en ese sitio les pide que prueben a que el asistente les cree una lista para hacer la maleta de las vacaciones, juegue con ellos al trivial sobre música de los 90, les ayude con los deberes y les pinte imágenes del horizonte de Nueva York.

Meta se ha estado esforzando por hacer llegar los productos de IA generativa a sus miles de millones de usuarios para desafiar la posición de liderazgo de OpenAI en esta tecnología, lo que ha supuesto una costosa revisión de la infraestructura informática y la consolidación de equipos de investigación y productos anteriormente distintos.

El gigante de las redes sociales ha estado liberando abiertamente sus modelos Llama para que los utilicen los desarrolladores que crean aplicaciones de IA como parte de su esfuerzo por ponerse al día, ya que una potente opción gratuita podría obstaculizar los planes de sus rivales de obtener ingresos con su tecnología patentada. La estrategia ha suscitado preocupaciones de seguridad por parte de críticos recelosos de lo que actores sin escrúpulos puedan utilizar el modelo para construir.

Meta equipó a Llama 3 con nuevas capacidades de codificación informática y esta vez la alimentó con imágenes además de texto en el entrenamiento, aunque por ahora el modelo sólo producirá texto, dijo en una entrevista Chris Cox, director de productos de Meta.

Un razonamiento más avanzado, como la capacidad de elaborar planes más largos de varios pasos, llegará en versiones posteriores, añadió. Las versiones cuyo lanzamiento está previsto para los próximos meses también serán capaces de "multimodalidad", lo que significa que podrán generar tanto texto como imágenes, dijo Meta en las entradas de su blog.

"El objetivo final es ayudar a quitarle cosas de encima, simplemente ayudar a hacerle la vida más fácil, ya sea interactuando con empresas, escribiendo algo o planificando un viaje", dijo Cox.

Cox dijo que la inclusión de imágenes en el entrenamiento de Llama 3 mejoraría una actualización que se lanzará este año a las gafas inteligentes Ray-Ban Meta, un producto fabricado con el fabricante de gafas Essilor Luxoticca, que permite a Meta AI identificar objetos vistos por el usuario y responder a preguntas sobre ellos.

Las acciones de Meta subían un 1,8% a última hora del jueves.

Meta también anunció una asociación con Google para incluir sus resultados de búsqueda en tiempo real en las respuestas del asistente, complementando un acuerdo existente con el motor de búsqueda Bing de Microsoft.

El asistente Meta AI se está expandiendo a más de una docena de mercados fuera de EE.UU. con la actualización, incluyendo Australia, Canadá, Singapur, Nigeria y Pakistán. Meta está "trabajando todavía en la forma correcta de hacerlo en Europa", dijo Cox, donde las normas de privacidad son más estrictas y la próxima Ley de IA está a punto de imponer requisitos como la divulgación de los datos de entrenamiento de los modelos.

La voraz necesidad de datos de los modelos de IA generativa ha surgido como una importante fuente de tensión en el desarrollo de la tecnología.

El consejero delegado de Meta, Mark Zuckerberg, hizo un guiño a la competencia con OpenAI en un vídeo que acompañaba al anuncio, en el que llamaba a Meta AI "el asistente de IA más inteligente que puede utilizar libremente".

Zuckerberg dijo que las dos versiones más pequeñas de Llama 3 que se están lanzando ahora, con 8.000 millones de parámetros y 70.000 millones de parámetros, obtuvieron puntuaciones favorables frente a otros modelos gratuitos en los puntos de referencia de rendimiento utilizados habitualmente para evaluar la calidad de los modelos. La versión más grande de Llama 3 aún se está entrenando, con 400.000 millones de parámetros, dijo.

Esos resultados fueron "sin duda impresionantes", pero también indicativos de una creciente brecha de rendimiento entre los modelos libres y los patentados, dijo Nathan Benaich, fundador de la empresa de capital riesgo Air Street Capital, centrada en la IA.

Los desarrolladores se han quejado de que la anterior versión Llama 2 del modelo no entendía el contexto básico, confundiendo las consultas sobre cómo "matar" a un programa informático con las peticiones de instrucciones para cometer un asesinato. Su rival Google se ha topado con problemas similares y hace poco suspendió el uso de su herramienta de generación de imágenes Gemini AI después de que suscitara críticas por producir representaciones inexactas de figuras históricas.

Meta dijo que redujo esos problemas en Llama 3 utilizando "datos de alta calidad" para conseguir que el modelo reconociera los matices. No dio más detalles sobre los conjuntos de datos utilizados, aunque dijo que introdujo siete veces más datos en Llama 3 de los que utilizó para Llama 2. (Reportaje de Katie Paul en Nueva York Reportaje adicional de Jeffrey Dastin en San Francisco Edición de Nick Zieminski y Matthew Lewis)