Con los editores web en crisis, un nuevo estándar abierto les permite establecer las reglas básicas para los raspadores de IA. (O al menos lo hará intentar.) El nuevo estándar de licencia realmente simple (RSL) crea términos que los participantes esperan que las empresas de IA cumplan. Aunque la aplicación es una pregunta abierta, no puede lastimar que algunos bateadores pesados la respalden. Entre otros, la lista incluye Reddit, Yahoo (empresa matriz de Engadget), Medium and People Inc.
RSL agrega términos de licencia al protocolo Robots.txt, el archivo simple que proporciona instrucciones para los rastreadores web. Las opciones de licencias compatibles incluyen gratuita, atribución, suscripción, pago por tren y pago por inferencia. (Esto último significa que las compañías de IA solo pagan a los editores cuando el contenido se usa para generar una respuesta).
Lanzamiento junto con el estándar es una nueva organización sin fines de lucro, la RSL Collective. Se ve a sí mismo como un equivalente de organizaciones sin fines de lucro como ASCAP e IMC, que administran regalías de la industria musical. El nuevo grupo dice que su estándar puede “establecer precios justos del mercado y fortalecer el apalancamiento de negociación para todos los editores”.
Las marcas participantes incluyen muchos viejos escolares de Internet. Reddit, People Inc., Yahoo, Internet Brands, Ziff Davis, Wikihow, O’Reilly Media, Medium, The Daily Beast, Miso.ai, Raptive, Ranker y Evolve Media están a bordo. El ex CEO de Ask.com Doug Leeds y el cocreador de RSS Eckart Walther lideran al grupo.
“El estándar RSL ofrece a los editores y plataformas una forma clara y escalable de establecer términos de licencia en la era de la IA”, escribió el CEO de Reddit Steve Huffman en un comunicado de prensa. “El RSL Collective ofrece un camino para hacerlo juntos. Reddit admite tanto como pasos importantes para proteger la red abierta y las comunidades que lo hacen prosperar”. (Vale la pena señalar que Reddit tiene acuerdos de licencia Opadai y Google.)
No está claro si las compañías de IA honrarán el estándar. Después de todo, se sabe que simplemente ignoran las instrucciones de robots.txt. Pero el grupo cree que sus términos serán legalmente exigibles.
En una entrevista con ARS TechnicaLeeds puntiagudo al reciente acuerdo de $ 1.5 mil millones de Anthrope, sugiriendo que “hay dinero real en juego” para las compañías de IA que no entrenan “legítimamente”. (Sin embargo, ese acuerdo está en el aire después de que un juez lo rechazó). Leeds dijo El borde que la naturaleza colectiva del estándar también podría ayudar a difundir los costos legales, lo que hace que los desafíos a las violaciones sean más factibles.
En cuanto a la aplicación técnica, el estándar RSL no puede bloquear los bots por sí solo. Para eso, el grupo se está asociando rápidamente con la compañía de nubes, lo que puede actuar como una especie de guardián. (Quizás Cloudflare, que recientemente lanzó un sistema de pago por truco, eventualmente también podría jugar un papel). Leeds dijo que rápidamente podría servir como “el gorila en la puerta del club”.
Leeds sugirió Ars que también hay incentivos para las empresas de IA. Financieramente, podría ser más simple para ellos que instalar acuerdos de licencias individuales. Podría evitar un problema en el contenido de IA: usar múltiples fuentes para una respuesta para evitar usar también Mucho de cualquiera. Si el contenido tiene licencia legal, la aplicación AI puede simplemente usar la mejor fuente, lo que proporciona al usuario una respuesta de mayor calidad y minimiza el riesgo de alucinaciones.
También hizo referencia a las quejas de las compañías de IA de que no hay medios efectivos para licenciar contenido en toda la web. “Los hemos escuchado, y lo que les hemos escuchado decir es … necesitamos un nuevo protocolo”, dijo Leeds ARS Technica. “Con el estándar RSL, las empresas de IA obtienen una” forma escalable de obtener todo el contenido “que desean, al tiempo que establecen un incentivo de que solo tendrán que pagar el mejor contenido al que sus modelos realmente hacen referencia. Si lo están usando, lo pagan, y si no lo usan, no lo pagan”.