AI Technology10.09.2025 г.6 мин четене

Нов стандарт за лицензиране на AI съдържание в интернет

Нов стандарт за лицензиране цели да позволи на уеб издателите да определят условията, при които разработчиците на AI системи използват тяхната работа. В сряда, големи брандове като Reddit, Yahoo, Medium, Quora и People Inc. обявиха подкрепата си за Really Simple Licensing (RSL), отворен стандарт за лицензиране на съдържание, който позволява на издателите да определят как ботовете трябва да плащат за извличане на данни от техните сайтове за обучение на AI. Те се надяват, че колективното действие ще им даде лост за влияние върху AI компаниите.

Стандартът RSL се основава на протокола robots.txt, който отдавна позволява на издателите да дават инструкции на уеб роботите за това кои части от сайта могат и не могат да бъдат достъпвани. Но вместо просто да казват „да“ или „не“ на конкретни ботове, уебсайтовете сега могат да добавят условия за лицензиране и роялти в своя robots.txt файл. Те могат също така да вграждат условията в онлайн книги, видеоклипове и обучителни набори от данни, за които може да искат компенсация.

Зад стандарта RSL стои новосформирана организация за права, наречена RSL Collective, ръководена от Екарт Валтер, създател на стандарта Really Simple Syndication (RSS) и бивш изпълнителен директор на CardSpring, и Дъг Лийдс, бивш изпълнителен директор на IAC Publishing и Ask.com. „Целта е да се създаде нов, мащабируем бизнес модел за интернет“, казва Валтер пред The Verge. „RSL взема някои от тези ранни идеи на RSS и създава нов слой за целия интернет, където правата за лицензиране и компенсация са дефинирани.“

Стандартът RSL поддържа различни модели на лицензиране, включително и безплатни. Собствениците на сайтове могат да поискат от AI компаниите да плащат абонамент или да определят такса за всяко извличане чрез стандарта RSL, която компаниите трябва да плащат всеки път, когато AI бот обхожда уебсайта. Те могат също така да въведат такса за всяко използване на информация, позволявайки на сайтовете да получават компенсация, когато AI модел използва тяхната работа за генериране на отговор. Ботовете, които обхождат сайтовете за други цели, като архивиране или включване в търсачки, могат да продължат както обикновено.

„Това, което правим, не е да преоткриваме колелото или да го изобретяваме.“

Няколко медийни компании, включително компанията майка на The Verge, Vox Media, собственикът на The Wall Street Journal, News Corp, и The New York Times, са сключили лицензионни споразумения с отделни AI компании като OpenAI и Amazon. Но RSL Collective цели да опрости този процес, като позволи на всеки собственик на уебсайт или създател да получи заплащане за своята работа, вместо да договаря отделни сделки.

Както при много стандарти, успехът на RSL зависи от това дали големите играчи в индустрията — в този случай AI компаниите — ще го приемат. Разработчиците на AI модели многократно са били обвинявани, че игнорират файловете robots.txt на сайтовете, и няма прост начин за изчисляване на такса за използване на информация без тяхното участие. RSL Collective залага на това, че обединяването на някои от най-големите уеб издатели ще направи приемането на стандарта по-привлекателно. „Нашата работа е да съберем голяма група хора, които да кажат, че е във ваш интерес, както ефективно, защото можете да преговаряте с всички наведнъж, така и законно, защото ако не го направите, нарушавате правата на всички наведнъж“, казва Лийдс.

Стандартът RSL сам по себе си също не може да блокира ботовете от посещение на уебсайт, за разлика от системата „плащане за обхождане“, предлагана от Cloudflare. RSL Collective в момента работи с Fastly, мрежа за доставка на съдържание, за да допуска AI ботове до уебсайтове въз основа на това дали са се съгласили да лицензират съдържание. Fastly е „охранителят на вратата на клуба, и те няма да пуснат хората, освен ако нямат правилната идентификация“, казва Лийдс. „RSL издава идентификациите. Така че ние казваме, 'Хей, вие сте се съгласили да лицензирате това съдържание,' и Fastly казва, 'Влезте, вашата идентификация е проверена.'“ Издателите, които не използват Fastly, все още могат да поискат от AI компаниите да лицензират тяхното съдържание, но няма да могат да блокират AI обхождащите до момента, в който повече доставчици изградят решение.

Лийдс вярва, че RSL Collective може също така да налага лицензите законно, тъй като той казва, че „всички участници в колективната организация за права участват в прилагането на всяко нарушение“, разпределяйки правните разходи. Той сравнява системата с вече съществуващи организации за цифрови права, като музикалната организация ASCAP, която събира лицензионни такси и ги разпределя на членовете. Въпреки че конвенционалното лицензиране на музика се ползва от особено силен и добре установен правен прецедент за защита на авторските права, неразрешеното извличане и използването на медии за обучение на AI системи все още попадат в правна сива зона, като големите AI играчи в момента се борят с дела от Reddit, Getty Images и много онлайн издатели.

„Винаги е имало въпрос дали ботовете са се съгласили с условия, които не виждат“, добавиха Лийдс и Валтер в имейл изявление. „RSL променя това фундаментално, като поставя роботите в известие за какви са условията, преди да достъпят сайт.“

Въпреки това, Лийдс се надява, че системата може да създаде интуитивен начин за навигация в лицензирането на произведения за обучение на AI. „Това, което правим, не е да преоткриваме колелото или да го изобретяваме — просто го пренасяме на място, където не е съществувало преди“, казва Лийдс. „Причината, поради която не е съществувало тук преди, е защото не е имало стандарт, върху който да се изгради. Затова стандартът RSL е толкова важен: той предоставя инфраструктурата, за да създаде нещата, които са работили във всяка друга медийна индустрия, която все още не се е случила.“

RSL Collective е безплатен за издателите и създателите да се присъединят, като други големи брандове като O'Reilly, wikiHow и собственикът на IGN Ziff Davis също са на борда.

Повече AI новини и услуги:

AI Новини | AI Услуги | Начало