La plataforma de medios sociales Reddit dijo el martes que actualizará un estándar web utilizado por la plataforma para bloquear el raspado automatizado de datos de su sitio web, tras los informes de que las startups de IA estaban eludiendo la norma para recopilar contenidos para sus sistemas.

La medida llega en un momento en que las empresas de inteligencia artificial han sido acusadas de plagiar contenidos de editoriales para crear resúmenes generados por IA sin dar crédito ni pedir permiso.

Reddit dijo que actualizaría el Protocolo de Exclusión de Robots, o "robots.txt", una norma ampliamente aceptada destinada a determinar qué partes de un sitio se permite rastrear.

La empresa también dijo que mantendrá la limitación de velocidad, una técnica utilizada para controlar el número de solicitudes de una entidad en particular, y que bloqueará los robots y rastreadores desconocidos para que no puedan hacer "data scraping" -recopilar y guardar información sin procesar- en su sitio web.

Más recientemente, robots.txt se ha convertido en una herramienta clave que los editores emplean para impedir que las empresas tecnológicas utilicen sus contenidos de forma gratuita para entrenar algoritmos de inteligencia artificial y crear resúmenes en respuesta a algunas consultas de búsqueda.

La semana pasada, la startup de licencias de contenidos TollBit envió una carta a los editores en la que afirmaba que varias empresas de IA estaban eludiendo la norma web para raspar los sitios de los editores.

Esto sigue a una investigación de Wired que descubrió que la startup de búsqueda de IA Perplexity probablemente eludió los esfuerzos para bloquear su rastreador web a través de robots.txt.

A principios de junio, la editorial de medios empresariales Forbes acusó a Perplexity de plagiar sus historias de investigación para utilizarlas en sistemas de IA generativa sin dar crédito.

Reddit dijo el martes que los investigadores y organizaciones como el Archivo de Internet seguirán teniendo acceso a su contenido para uso no comercial. (Reportaje de Harshita Mary Varghese; Edición de Alan Barona)