Позов проти OpenAI за порушення авторських прав

Відомий письменник Джордж Р. Р. Мартін та ряд інших авторів звернулися до суду з претензіями до OpenAI, заявляючи про порушення авторських прав. Це не єдиний випадок, коли ставлення до інтелектуальної власності у контексті штучного інтелекту викликає суперечки.

З моменту появи ChatGPT, популярного чатбота на базі штучного інтелекту, питання авторських прав стали особливо актуальними. Важливим фактором є те, що для навчання мовних моделей потрібен обширний датасет. Розробники часто користуються великою кількістю інформації з Інтернету та інших джерел. Однак часто такі джерела захищені авторським правом, і використання їх без відповідного дозволу веде до юридичних спорів.

Конкретні заяви письменників

За інформацією, Гільдія авторів та група письменників звернулися до суду Південного округу Нью-Йорка. Серед позивачів – видатні автори, такі як Джонатан Франзен, Джоді Піколт, Джон Грішем та інші. Вони намагаються досягти визнання їх позову як колективного.

У позові зазначено, що OpenAI "без дозволу копіювала та використовувала їх твори", інтегруючи матеріали, захищені авторським правом, у свої мовні моделі. Такі дії, за словами авторів, загрожують їх професійному існуванню, оскільки мовні моделі можуть автоматично генерувати текст, за який раніше платились авторські відрахування.

Позивачі також висловлюють побоювання, що продукція OpenAI може привести до створення проізводних творів на основі їх книг, що, в свою чергу, може пошкодити їх комерційні інтереси.

Відповідь OpenAI

Відповідаючи на ці обвинувачення, OpenAI заявляє, що активно спілкується з авторами і Гільдією, намагаючись з'ясувати їхні побоювання стосовно використання штучного інтелекту.

Цей інцидент стає лише одним із численних випадків, коли автори зверталися до суду з претензіями до OpenAI

Після прочитання даної новини почав переписку з Chat GPT

Роман Радейко. Чи навчалися ти на книгах американського письменника-фантаста, сценариста і продюсера Джордж Мартін

Сhat GPT. Так, я знайомий із творами Джорджа Р. Р. Мартіна (George R. R. Martin), американського письменника-фантаста, сценариста і продюсера. Найвідомішим його твором є серія книг "Пісня Льоду та Вогню" ("A Song of Ice and Fire"), на основі якої було створено популярний телесеріал "Гра престолів" ("Game of Thrones").

Я можу надати інформацію про його книги, героїв, інтриги та інші елементи його творчості. Що саме вас цікавить?

Роман Радейко. На яких саме джерелах ти навчався. Звідки ти брав дані.

Сhat GPT. Я був натренований на великому масиві даних, який включає в себе:

Книги з різних джерел і жанрів.
Веб-сторінки, включаючи контент із Вікіпедії та інших енциклопедичних джерел.
Наукові статті.
Новини.
Веб-сайти, які надають інструкції та пояснення на різні теми.
Форуми та інші платформи для спілкування.

Та інші. Проте слід зазначити, що я не маю можливості з'єднуватися з інтернетом або шукати актуальну інформацію в реальному часі. Моя база даних має обмеження, яке датується січнем 2022 року.

OpenAI не надає конкретних назв або списків джерел, з яких була отримана інформація, але вони взяли зобов'язання використовувати надійні та авторитетні джерела для тренування моделі.

Роман Радейко. Чи вбачаєш порушення авторських прав при використанні книг для навчання, зокрема книги Джорджа Мартіна?

Сhat GPT. Я не є юристом, але можу сказати декілька загальних речей на цю тему. Використання текстів для тренування машинного навчання може стикатися з питаннями авторських прав, особливо якщо використовуються повні тексти чи великі їхні частини.

OpenAI докладає зусиль, щоб враховувати авторські права під час створення моделей як GPT-4. Тексти, що порушують авторські права, не використовуються безпосередньо у своєму первісному вигляді. Замість цього модель "вчиться" на основі агрегованої інформації з численних джерел, формуючи знання та вміння відповідати на запитання або генерувати текст.

Важливо розуміти, що під час відповіді на питання я не "копіюю" вміст з конкретних книг або інших джерел, а генерую відповідь на основі своєї внутрішньої моделі мови, яка була натренована на великих даних.

Для конкретних питань про авторські права та їхнє порушення краще звертатися до юридичних експертів.

Роман Радейко. Напиши відповідь на це питання як юрист у сфері авторського права.

Сhat GPT. Як юрист у сфері авторського права, я б міг відзначити наступне:

Використання текстів в процесі тренування машинного навчання може порушувати авторські права, якщо це використання не підпадає під виключення або обмеження, передбачені законодавством про авторське право. Авторське право, за своєю природою, надає авторам ексклюзивні права на використання та розповсюдження своїх творів. Це означає, що без дозволу автора або іншого власника права третя сторона не може використовувати твір у способи, які обмежені цими правами.

Однак існують певні виключення та обмеження в авторському праві, які дозволяють використовувати твори без дозволу. У деяких країнах, наприклад, існує поняття "справедливого використання" ("fair use"), яке дозволяє використовувати твори без дозволу в певних обставинах, зокрема для навчання, критики, коментування тощо.

Питання про те, чи підпадає тренування машинного навчання під ці виключення, є предметом дебатів і може залежати від конкретного законодавства країни та судової практики.

Важливо розуміти, що навіть якщо тренування моделі на певному тексті не порушує авторські права, повторне відтворення або розповсюдження цього тексту моделлю може бути порушенням.

У кінцевому рахунку, щоб отримати точну правову думку з цього питання, рекомендується звертатися до юриста, який спеціалізується на авторському праві у вашій юрисдикції.

Роман Радейко. Чи порушує open AI авторські права інших авторів, коли використовує їх твори для машинного навчання?

Сhat GPT. OpenAI — це дослідницька організація, яка приділяє увагу етичним, юридичним та соціальним аспектам своєї роботи. Щодо авторських прав та використання творів у процесі машинного навчання, кілька моментів варто врахувати:

Виключення та обмеження авторського права: Деякі юрисдикції передбачають виключення або обмеження щодо використання творів для певних цілей, таких як навчання або дослідження. Наприклад, поняття "справедливого використання" у США може дозволити використання творів для машинного навчання в певних обставинах.
Агреговані дані: Моделі, такі як GPT-4, не "зберігають" твори у їх первісному вигляді. Замість цього вони аналізують та вивчають структуру мови з великої кількості текстів, а потім використовують це знання для генерування нових текстів. Тобто, хоча модель може бути навчена на основі певного тексту, вона не "копіює" цей текст, коли генерує відповіді.
Зусилля OpenAI: OpenAI робить зусилля для того, щоб дотримуватися відповідних юридичних та етичних стандартів. Проте конкретні деталі того, як і з яких джерел були отримані дані для тренування, не розкриваються повністю.

Якщо у вас є конкретні питання або занепокоєння щодо авторських прав, рекомендується звертатися до юридичного представника або консультанта у цій сфері.

{$te}

{$te}