Meta Platforms utilizó publicaciones públicas de Facebook e Instagram para entrenar a su nuevo asistente virtual de inteligencia artificial Meta, pero excluyó las publicaciones privadas compartidas sólo con familiares y amigos en un esfuerzo por respetar la privacidad de los consumidores, según declaró a Reuters en una entrevista el máximo responsable político de la empresa.

Meta tampoco utilizó chats privados en sus servicios de mensajería como datos de entrenamiento para el modelo y tomó medidas para filtrar los detalles privados de los conjuntos de datos públicos utilizados para el entrenamiento, dijo el presidente de Asuntos Globales de Meta, Nick Clegg, hablando al margen de la conferencia anual Connect de la compañía esta semana.

"Hemos intentado excluir los conjuntos de datos que tienen una gran preponderancia de información personal", dijo Clegg, añadiendo que la "gran mayoría" de los datos utilizados por Meta para el entrenamiento estaban disponibles públicamente.

Citó LinkedIn como ejemplo de un sitio web cuyo contenido Meta decidió deliberadamente no utilizar por motivos de privacidad.

Los comentarios de Clegg se producen cuando empresas tecnológicas como Meta, OpenAI y Google, de Alphabet, han sido criticadas por utilizar información raspada de Internet sin permiso para entrenar sus modelos de IA, que ingieren cantidades ingentes de datos para resumir información y generar imágenes.

Las empresas están sopesando cómo gestionar los materiales privados o protegidos por derechos de autor aspirados en ese proceso que sus sistemas de IA pueden reproducir, al tiempo que se enfrentan a demandas de autores que les acusan de infringir los derechos de autor.

Meta AI fue el producto más significativo entre las primeras herramientas de IA orientadas al consumidor que la empresa dio a conocer el miércoles su consejero delegado, Mark Zuckerberg, en la conferencia anual de productos de Meta, Connect. El evento de este año estuvo dominado por las conversaciones sobre inteligencia artificial, a diferencia de las conferencias pasadas, que se centraron en la realidad aumentada y virtual.

Meta fabricó el asistente utilizando un modelo personalizado basado en el potente modelo de lenguaje de gran tamaño Llama 2 que la empresa lanzó para uso comercial público en julio, dijo la compañía.

Será capaz de generar texto, audio e imágenes y tendrá acceso a información en tiempo real a través de una asociación con el motor de búsqueda Bing de Microsoft.

Las publicaciones públicas de Facebook e Instagram que se utilizaron para entrenar a Meta AI incluían tanto texto como fotos, explicó Clegg.

Dijo que Meta también impuso restricciones de seguridad sobre el contenido que la herramienta podía generar, como la prohibición de crear imágenes fotorrealistas de figuras públicas.

En cuanto a los materiales protegidos por derechos de autor, Clegg dijo que esperaba una "buena cantidad de litigios" sobre la cuestión de "si el contenido creativo está cubierto o no por la doctrina de uso justo existente", que permite el uso limitado de obras protegidas para fines tales como comentarios, investigación y parodia.

"Creemos que sí lo está, pero tengo la firme sospecha de que eso va a desembocar en un litigio", dijo Clegg.

Algunas empresas con herramientas de generación de imágenes facilitan la reproducción de personajes icónicos como Mickey Mouse, mientras que otras han pagado por los materiales o han evitado deliberadamente incluirlos en los datos de entrenamiento.

OpenAI, por ejemplo, firmó este verano un acuerdo de seis años con el proveedor de contenidos Shutterstock para utilizar las bibliotecas de imágenes, vídeos y música de la empresa para el entrenamiento.

A la pregunta de si Meta había tomado alguna medida de este tipo para evitar la reproducción de imágenes protegidas por derechos de autor, un portavoz de Meta señaló las nuevas condiciones de servicio que prohíben a los usuarios generar contenidos que violen la privacidad y los derechos de propiedad intelectual.