Postulaty Repropolu na Forum Prawa Autorskiego

Opublikowano: 16.09.2024

Stowarzyszenie Dziennikarzy i Wydawców Repropol wraz z Izbą Wydawców Prasy i Stowarzyszeniem Gazet Lokalnych przygotowały i przesłały do Ministerstwa Kultury i Dziedzictwa Narodowego oraz zaprezentowały w dniu 10.09.2024 roku na Forum Prawa Autorskiego postulaty dotyczące oczekiwanych zmian w Ustawie o prawie autorskim i prawach pokrewnych. Objęły one w szczególności tematykę związaną ze sztuczną inteligencją oraz zgłaszane już wcześniej, a nieuwzgędnione w obecnie wchodzącej nowelizacji tej Ustawy.

Uwagi generalne

Wywołane ofensywą sztucznej inteligencji zmiany cywilizacyjne mają bezpośredni wpływ na regulacje prawa autorskiego. Celem systemu prawnoautorskiego jest zabezpieczenie możliwości niezakłóconego czerpania korzyści przez twórców z niematerialnych owoców ich intelektu, z należytym poszanowaniem interesu społeczeństwa w dostępie do utworów – w ramach systemu ograniczeń i wyjątków z monopolu prawnoautorskiego. Pojawienie się modeli generatywnej AI stanowi po wielokroć wyzwanie dla dotychczasowych zasad. Przede wszystkim, AI nieodwracalnie przełamuje wyłączność człowieka na tworzenie treści, które obiektywnie są równowartościowe treściom „ludzkim”,. Kolejną diametralną odmiennością jest całkowite zdominowanie rzeczywistości cyfrowej przez globalnych graczy, którzy również w sektorze prawnoautorskim czerpią z dorobku pokoleń twórców konsumując ich utwory, samemu niczego nie tworząc. W ten sposób utrwala się paradoksalna sytuacja (tzw. value gap), w której platformy internetowe czerpią zdecydowanie najwięcej korzyści z pośredniczenia pomiędzy twórcami a użytkownikami utworów, mimo iż same nie przyczyniają się do wzbogacenia dorobku kulturowego.

Zachodzące zmiany muszą zostać odzwierciedlone w przepisach prawa autorskiego.

Po pierwsze, kluczowe jest stworzenie takich ram regulacyjnych, które z jednakową uwagą będą traktować innowacje oraz korzyści kręgów twórczych z wykorzystania ich dorobku. W przełożeniu na realia rodzimego rynku: zadaniem polskiego prawodawcy jest premiowanie interesu polskiej kultury i przedkładanie go nad interes zagranicznych koncernów technologicznych. Mamy głębokie przekonanie, że tylko taka perspektywa stanowi polską rację stanu. Nie uciekając się do nadmiernej emfazy, brak należnego i należytego finansowania polskiej kultury, w tym polskich mediów, stanowi bezpośredni cios w samo serce demokracji. W tym kontekście, wyrażamy najgłębszy żal z powodu ponad trzyletniego opóźnienia w implementacji na grunt polskiego prawa dyrektywy o prawie autorskim na JRC. Te trzy lata zwłoki to konkretny, bardzo dotkliwy uszczerbek finansowy dla wszystkich polskich mediów, na czele z wydawcami prasy.

Po drugie, obok samej litery prawa materialnego, egzystencjalnie ważne jest stworzenie mechanizmów prawnych umożliwiających wyegzekwowanie prawa. Wieloletnie doświadczenia na gruncie prawa europejskiego pokazują, jak trudne jest prowadzenie racjonalnego dialogu z gigantami technologicznymi.

Po trzecie, długofalowe zmiany prawa autorskiego są możliwe wyłącznie na płaszczyźnie unijnej. Akt ws. sztucznej inteligencji stanowi dobry początek zmiany, aby wszyscy uczestnicy rynku cyfrowego przestrzegali prawa autorskiego. Zdajemy sobie sprawę, że niektóre z poniższych punktów wymagają zaangażowania brukselskiego ustawodawcy (np. wynagrodzenie za korzystanie z utworów w celu trenowania generatywnych modeli AI, wprowadzenie domniemań czy rozszerzenie zakresu „korzystania z utworu”). Z pewnością przejęcie prezydencji przez Polskę w I. poł 2025 roku będzie doskonałą okazją do odbycia takiej dyskusji.

Niezależnie jednak od tego, że wiele fundamentalnych aktów prawnych dotyczących prawa autorskiego lub AI powstaje na szczeblu UE, należy w polskim systemie prawnym jak najszybciej zawrzeć – niekolidujące z wyższymi regulacjami – przepisy obejmujące prawa autorskie i pokrewne do publikacji prasowych ochroną w zakresie wykorzystywania ich przez generatywne narzędzia AI. W celu wprowadzania skutecznych systemów egzekwowania wspomnianej ochrony, konieczne jest natomiast znowelizowanie krajowych przepisów.

Postulowane tematy do dyskusji i wdrożenia do polskiego systemu prawnego

  1. Szybkie procedowanie przed Komisją Prawa Autorskiego

Biorąc pod uwagę fakt, iż najskuteczniejszym i najmniej kosztownym sposobem zarządzania prawem autorskim lub prawem pokrewnym, jest system zbiorowego zarządzania prawami uprawnionych przez organizację zbiorowego zarządzania, obok wprowadzonego do ustawy rozszerzonego zbiorowego zarządzania, należy zapewnić skuteczność procesu zatwierdzania tabel wynagrodzeń przed Komisją Prawa Autorskiego. Konieczna w tym zakresie jest modyfikacja ustawy o zbiorowym zarządzaniu prawami autorskimi i prawami pokrewnymi, poprzez wpisanie krótkich terminów procedowania wniosków o zatwierdzenie tabel. Ponadto kluczowym jest także wprowadzenie szybkiej ścieżki sądowej, w przypadku zaskarżenia decyzji Komisji do sądu. Należy zatem przewidzieć krótkie terminy procedowania tego typu spraw przez sądy administracyjne, względnie zmienić równocześnie właściwość i przekazać te sprawy do sądów własności intelektualnej.

  1. Korzystanie z generatywnych narzędzi AI

U podstaw wydolności generatywnych narzędzi AI leżą olbrzymie zbiory danych treningowych, wśród których znajdują się także materiały chronione prawem autorskim lub pokrewnym. Z technicznego punktu widzenia trenowanie modeli AI wymaga zwielokrotnienia danych, a tym samym wymaga zgody podmiotów prawnoautorsko uprawnionych. Narzędzia generatywnej AI są w stanie generować coraz bardziej zaawansowane treści dowolnego rodzaju, w dowolnej ilości, właściwie bez ponoszenia kosztów. W gruncie rzeczy są one narzędziami stricte komercyjnymi, służącymi zarabianiu, a obecnie trwają intensywne poszukiwania sposobów ich komercjalizacji (można założyć, że modele subskrypcyjne, jak w przypadku modelu GPT, nie są docelowym sposobem ich gospodarczego wykorzystania). Dominującym trendem jest obecnie integracja tych narzędzi w ramach cyfrowego ekosystemu danego dostawcy. Modelowym przykładem jest Google AI Overview – nowa funkcja wyszukiwarki Google automatycznie generująca podsumowania odpowiedzi na zapytania użytkowników.

Dostawcy narzędzi generatywnej AI masowo wykorzystują dostępne w sieci internetowej treści dla trenowania algorytmów w ramach eksploracji tekstów i danych (text-data-mining, TDM). TDM stanowi dopuszczalny przez przepisy prawa autorskiego proces pozyskiwania zawartości z olbrzymich zbiorów danych. Technologia ta jest znana i praktykowana już od wielu lat. Poza sporem jednak pozostaje, że w czasie prac nad dyrektywą o prawie autorskim na JRC nie dyskutowano o zastosowaniu TDM w odniesieniu do modeli generujących treści, ponieważ eksplozja tych ostatnich nastąpiła dopiero po 2019 r., czyli po wejściu dyrektywy w życie. Skoro prawodawca nie miał, bo mieć nie mógł, świadomości funkcjonowania systemów produkujących treść w oparciu o ludzki kontent, TDM nie powinien obejmować modeli AI o generatywnej funkcjonalności.

Z prawnoautorskiego punktu widzenia eksploracja tekstów i danych stanowi wyjątek, który – jak wszystkie wyjątki w prawie autorskim – podlega weryfikacji w świetle tzw. testu trójstopniowego. Jego podstawowym elementem jest ocena, czy dany wyjątek godzi w „słuszne interesy twórców” (art. 35 ustawy o prawie autorskim i prawach pokrewnych) poszczególnych utworów wykorzystanych w procesie TDM. Generowanie przez AI kontentu, który niejednokrotnie stanowi konkurencję wobec utworów wykorzystanych dla wytrenowania sztucznej inteligencji, godzi bezpośrednio w żywotne interesy twórców pozbawiając ich korzyści z własnej twórczości. Co więcej, twórcy – przynajmniej na obszarze UE – wciąż nie otrzymują żadnego wynagrodzenia z tytułu wykorzystania ich pracy intelektualnej. Objęcie wyjątkiem TDM funkcjonowania generatywnych modeli AI pozostawałoby zatem w systemowej sprzeczności z elementarnym poczuciem sprawiedliwości, którego wyrazem jest test trójstopniowy.

Okolicznością, która nie jest bez znaczenia dla tej oceny jest również i to, że proces trenowania systemów AI trwa od dawna. Można założyć, że dostawcy modeli generatywnej AI rozpoczęli korzystanie z danych dostępnych w internecie, który nie jest przecież strefą pozbawioną ochrony prawnoautorskiej, jeszcze przed wdrożeniem w poszczególnych krajach unijnych wyjątku TDM. Jeśli założyć stosowanie w takim przypadku unijnych norm prawa autorskiego, dochodziło wówczas do naruszenia prawa autorskiego.

Podsumowując, trenowanie generatywnych modeli AI powinno zostać wykluczone z zakresu dozwolonej prawem autorskim eksploracji tekstów i danych.

  1. Wynagrodzenie za korzystanie w ramach komercyjnego TDM

W przypadku braku wyłączenia generatywnej AI z zakresu TDM korzystanie w takich przypadkach z cudzej twórczości wymaga ustawowego wynagrodzenia. Z tego powodu niezbędne jest uzupełnienie art. 26(3) projektowanej ustawy o prawie autorskim o zapis dotyczący odpłatności komercyjnego TDM. W takich przypadkach dyrektywa o prawie autorskim na JRC nie wyklucza możliwości wynagrodzenia twórców za korzystanie z ich utworów.

Ustalenie zasad wynagradzania wymaga szybkiego działania. Z uwagi na powszechnie znane trudności z nawiązaniem racjonalnego ekonomicznie dialogu z globalnymi dostawcami systemów AI konieczne jest przyjęcie mechanizmów zapewniających efektywność wynagradzania. Należy do nich przede wszystkim monitorowanie przestrzegania przez podmioty korzystające z cudzych utworów obowiązku transparentności w zakresie materiału treningowego (taki obowiązek wynika z art. 53 ust. 1 lit d, a znajduje swoje wsparcie w art. 56 ust. 2 lit. b Aktu ws. sztucznej inteligencji). Konieczne jest również wprowadzenie efektywnego mechanizmu weryfikacji rzetelności i prawdziwości danych przekazywanych przez dostawców modeli AI.

Na marginesie, wynagradzanie za korzystanie z utworów pozostaje także w uzasadnionym interesie samych dostawców modeli generatywnej AI. Ich dalszy rozwój jest bezpośrednio powiązany z dostępem do możliwie największej ilości danych stworzonych ludzką ręką, ponieważ bazowanie przez producentów na danych wytworzonych maszynowo (danych syntetycznych) prowadzi do degeneracji modeli.

  1. Komercyjna eksploracja tekstów i danych

Na szczególną uwagę ustawodawcy zasługują przepisy umożliwiające eksplorację tekstów i danych do celów komercyjnych. Systemy AI będą niewątpliwie odgrywały coraz większe znaczenie w każdym obszarze funkcjonowania społeczeństwa. Prawodawca musi ze szczególną wnikliwością rozważyć takie brzmienie art. 26(3), które doprowadzi do symetrii pomiędzy zarówno interesem podmiotów korzystających z danych dla uczenia swoich komercyjnych narzędzi AI, jak i uprawnionych do danych zainteresowanych w czerpaniu korzyści z każdego aktu ich eksploatacji.

Mając powyższe na uwadze konieczne jest:

  • dopuszczenie eksploracji tekstów i danych w celach komercyjnych jedynie pod warunkiem, iż materiał treningowy był legalnie udostępniony w sieci internetowej; uznanie odmiennego stanowiska, tj. dopuszczalności uczenia maszyn na pirackich zasobach danych, będzie kolejnym ciosem w najszerzej pojmowany interes podmiotów uprawnionych do danych;
  • wyraźne przesądzenie, iż zastrzeżenie braku możliwości trenowania na własnych utworach (tzw. opt-out) jest możliwe również poprzez zwykły, tj. pisany językiem naturalnym zapis takiego zakazu np. w warunkach korzystania ze stron internetowych. Taka możliwość wynika z motywu 19 dyrektywy, wedle którego zastrzeżenie winno nadawać się do „odczytu maszynowego, łącznie z (…) warunkami korzystania ze strony internetowej lub usługi”.
  • Zmiany w prawie pokrewnym wydawców prasy

Dla uzyskania pełnej zgodności z dyrektywą o prawie autorskim na JRC prawo pokrewne wydawców prasy (art. 997– 9917 projektowanej ustawy o prawie autorskim) wymaga dalszych poprawek.

Wykreślenie „celowości” zwielokrotniania publikacji prasowej

Konieczna jest zmiana art. 997 ust. 2 pkt 1 ustawy o pr. aut. poprzez wykreślenie powiązania pola eksploatacji zwielokrotniania publikacji prasowej z jej publicznym udostępnieniem („zwielokrotniania publikacji prasowej w celu korzystania z niej na polu eksploatacji, o którym mowa w pkt 2”). Takie brzmienie zaimplementowanego przepisu stoi w sprzeczności z brzmieniem implementowanego art. 15 ust. 1, akapit 1:

Państwa członkowskie zapewniają wydawcom publikacji prasowych mającym siedzibę w danym państwie członkowskim prawa przewidziane w art. 2 i art. 3 ust. 2 dyrektywy 2001/29/WE w zakresie sposobów korzystania online z ich publikacji prasowych przez dostawców usług społeczeństwa informacyjnego”.

Jedynymi przepisami służącymi wykładni zakresu zwielokrotnienia oraz publicznego udostępnienia są – odpowiednio – art. 2 i 3 ust. 1 dyrektywy 2001/29. Obecna implementacja w Polsce zawęża tym samym zakres prawa wynikający z dyrektywy.

Wykazanie „celu” zwielokrotnienia postawi podmioty uprawione do publikacji prasowych w bardzo trudnej sytuacji dowodowej. Jak bowiem wykazać zamiar zwielokrotniania całych roczników prasy? Pozostawienie obecnego brzmienia sprawi, że poza zakresem prawa pokrewnego pozostaną przypadki kopiowania archiwów prasowych „na zapas”, które to jednak archiwa będą mogły być udostępnione publicznie po dłuższym okresie czasu. W takiej sytuacji kopiujący mógłby przecież argumentować, że dokonane zwielokrotnienie nie było czynione – w momencie kopiowania – w celu publicznego udostępnienia materiału prasowego. Gdyby taka wykładnia przepisu zyskała powszechną aprobatę, mocno ucierpiałaby efektywność prawa pokrewnego. 

Niedopuszczalny „efekt substytucyjności” 

Jeśli celem ustanowienia prawa pokrewnego wydawców prasy jest umożliwienie wydawcom prasowym (a pośrednio również dziennikarzom) czerpania korzyści z publikacji prasowych, rozsądne jest uzależnienie zakresu dozwolonego korzystania z publikacji prasowych nie tylko od tego, czy wykorzystany fragment nie jest dłuższy niż „pojedyncze słowa lub bardzo krótkie fragmenty publikacji prasowej”. Może bowiem być i tak, że rozpowszechnienie już krótkiego fragmentu publikacji prasowej będzie na tyle zdradzało jej treść, że czytelnik zostanie pobawiony motywacji zapoznania się z całą publikacją. Tymczasem z motywu 58 DSM jasno wynika, iż wyłączenie dotyczące „bardzo krótkich fragmentów” musi być interpretowane „w sposób niewpływający na skuteczność” prawa pokrewnego wydawców prasy.

Dlatego też niezbędne jest wprowadzenie w art. 997 ust. 3 zakazu substytuowania publikacji prasowej przez jej fragment.

  • Zagadnienia ogólne

Wprowadzenie domniemań

Istotą systemów AI, która wynika z samej definicji zawartej w art. 3 Aktu ws. sztucznej inteligencji, jest wewnętrzy poziom skomplikowania uniemożliwiający zrozumiałe wytłumaczenie ich funkcjonowania (tzw. black-box). Zwłaszcza dla podmiotów trzecich monitorowanie sposobu działania systemów AI, w tym zakresu korzystania z materiałów w celu trenowania, jest niemożliwe.

Dla zrównoważenia sytuacji prawnej, w celu choćby częściowej neutralizacji tej niekorzystnej charakterystyki systemów AI, a także dla zapewnienia efektywności praw wynikających z dyrektywy DSM, niezbędne jest wprowadzenie szeregu domniemań prawnych.

Przede wszystkim ważne jest wprowadzenie domniemania wykorzystania przez dostawców modeli AI materiałów objętych ochroną prawnoautorską. Domniemanie pozostawałoby w całkowitej zgodzie z rzeczywistością, skoro jest bezsporne, że gros dostępnego dla trenowania materiału stanowią przedmioty chronione prawem autorskim. Co więcej, właśnie te ostatnie, starannie napisane ludzką ręką (należą do nich przede wszystkim materiały prasowe) stanowią szczególnie wartościowy materiał treningowy. Jednocześnie w razie sporu sądowego dochodzący roszczeń podmiot nie będzie dysponował realną możliwością dokładnego wykazania publikacji wykorzystanych przez dostawcę modelu AI. Jedynym podmiotem dysponującym taką wiedzą jest producent danego systemu.

Rozszerzenie zakresu „korzystania z utworu”

Mając na uwadze, że zakres majątkowych praw autorskich został wytyczony w analogowych realiach korzystania z utworów, konieczne jest rozciągnięcie zakresu ochrony prawnoautorskiej również na korzystanie z utworu w sposób inny niż poprzez jego zwielokrotnienie. Z uwagi na postępujący rozwój technologiczny należy założyć, że ekstrahowanie zawartości informacyjnej z danych treningowych wkrótce będzie możliwe bez jakiegokolwiek zwielokrotnienia. W takiej sytuacji, dość paradoksalnie, twórcy kontentu medialnego zostaną z jednej strony pozbawieni intelektualnej zawartości wytworów swoich rąk, a z drugiej – będą pozbawieni ochrony prawnoautorskiej wynikającej z samego faktu powołania utworów do istnienia.

Podsumowanie

Biorąc powyższe pod uwagę, należy pilnie podjąć prace nad aktualizacją ustawy o prawie autorskim i prawach pokrewnych oraz ustawy o zbiorowym zarządzaniu prawami autorskimi i prawami pokrewnymi , w celu wprowadzenia następujących rozwiązań:

  • wprowadzenie szybkiej ścieżki postępowania o zatwierdzenie tabel wynagrodzeń przez Komisję Prawa Autorskiego, w szczególności w zakresie możliwośći odwołania się od decyzji Komisji do sądów (skrócenie i precyzyjne określenie okresów procedowania, ewentualna zmiana właściwości sądów i przekazanie spraw do sądów własności intelektualnej);
  • wprowadzenie legalności źródła jako warunku dla możliwości powołania się na wyjątek eksploracji tekstów i danych (text and data mining- TDM, nowy art. 262 ust. 1 oraz art. 263 ust. 1), co może być dokonane poprzez doprecyzowanie klauzul generalnych (art. 34 i 35);
  • zakaz stosowania wyjątku komercyjnego TDM przez modele generatywnej inteligencji;
  • wprowadzenie odpłatności przy komercyjnym TDM;
  • poprawienie zakresu pól eksploatacji objętych prawem pokrewnym (nowy art. 997 ust. 2 pkt 1), poprzez usunięcie warunku „celowości”;

Odpowiednie zmiany dotyczące TDM należy także wprowadzić w ustawie o ochronie baz danych.

Nasza strona korzysta z plików cookies. Szczegóły w dokumencie: Polityka prywatności (RODO)