Rekonesans w sieci #113 Prawo autorskie w czasach zarazy
Kod oprogramowania miał stać się sposobem egzekwowania prawa, ale firmom technologicznym to nie wystarcza. Chcą podporządkować prawo temu, jak chcą rozwijać swoje technologie.
Łatwo powiedzieć, że prawo autorskie jest przestarzałe i nie nadąża za zmianami technologicznymi. To banalne stwierdzenie zaciemnia bardziej skomplikowany obraz tego, że zmiany technologiczne mają ogromny (często negatywny) wpływ na osoby twórcze, ich prawa oraz na istniejące modele biznesowe. Prawo może służyć spowalnianiu (a nie zatrzymywaniu) tych zmian tak, aby podczas adaptacji unikać kryzysów czy niesprawiedliwości. W ostatnich latach przesłał być to proces o charakterze równoważenia wpływów. Technologie cyfrowe (w formie kodu) coraz częściej pełnią funkcję regulatora — podobnie jak prawo — co opisał już w 1999 roku prof. Lessig, współtwórca ruchu Creative Commons. W epoce tzw. hyperscallingu sztucznej inteligencji (czyli skalowania architektur AI do coraz większych wymagań), firmy technologiczne idą o krok dalej: dążą do takiej reinterpretacji prawa, by wspierało ono ich cele rozwojowe, a nie chroniło interesy twórców.
W narracji firm budujących narzędzia AI poświęcenie dotychczasowego modelu pracy twórczej jest po prostu konieczne. Na razie nie oferują one jednak w zamian niczego tym, których została wykorzystana do stworzenia narzędzi AI, jak i tym, których praca gwałtownie się zmienia.
Niepewna przyszłość dozwolonego użytku
W kolejnym badaniu LLM-ów (Large Language Models) badaczom i badaczkom udało się uzyskać spore części utworów podlegających ochronie prawno-autorskiej. Tym razem badaczom udało się wydobyć niemal połowę treści „Harry’ego Pottera” — uzyskanej z narzędzi AI od Meta. Wcześniejsze analizy modeli ChatGPT (3.5 i 4) przyniosły podobne efekty: fragmenty, a nawet całe rozdziały książek. To pokazuje nie tylko, że LLM-y były trenowane na chronionych treściach, ale – co istotniejsze – że potrafią je dziś odtworzyć.
Dlaczego to ważne? Bardzo głośny proces New York Times’a przeciw Open AI i Microsoft wszedł już w fazę audytu, czyli sprawdzania przez ekspertów pod kątem obecności chronionych utworów w danych treningowych, ale również możliwości uzyskania ich od narzędzi za pomocą promptowania. OpenAI broni się jak tylko może m.in, strasząc użytkowników zagrożeniami dla ich prywatności: w ramach audytu dostęp do danych przez OpenAI i audytorów będzie wydłużony. Znacznie głośniejszym argumentem, którego używają, jest to, że „szkolenie modeli AI przy użyciu publicznie dostępnych materiałów internetowych jest dozwolonym użytkiem, co potwierdzają długotrwałe i powszechnie akceptowane precedensy”.
OpenAI liczy na podobną decyzję jak w 2015 r., wobec Google Books, która pozwoliła na skanowanie milionów książek chronionych prawem autorskim w celu stworzenia wyszukiwarki treści. To, co różni Google od OpenAI, to nie tylko strategia prawna, ale też architektura usług — zaprojektowana tak, by minimalizować ryzyko nadużyć. Google Book Search pokazywał tylko krótki „fragment” z dowolnej strony w wynikach wyszukiwania. Nie dało się również odtworzyć całej książki w całość w ramach wielu wyszukiwań. Mądre po szkodzie OpenAI zaczęło wprowadzać różne ograniczenia, ale w tym czasie wydawcom i twórcom udało się zebrać dowodów na tyle, by wytoczyć im procesy.
Ilustracja: przytoczony w pozwie New York Times kontra OpenAI fragment wygenerowanego artykułu prasowego różniący się od oryginału jednym słowem.
Skąd taka panika? Być może firmy takie jak OpenAI spodziewają się, że sądy nie staną po ich stronie, a dorzucają coraz więcej ognia do PR-u i lobbingu. Ostatnio zaczęły nawet straszyć tym, że bez nieograniczonego trenowania swoich modeli cały biznes upadnie i USA przegra cyfrową zimną wojnę z Chinami. Te strategie wydają się niestety działać. Niedawno prezydent Trump zwolnił szefa amerykańskiego biura ds. praw autorskich – zaledwie kilka dni po tym, urząd ten opublikował kolejny raport o tym, jak aktualny rozwój sztucznej inteligencji może naruszać prawo do dozwolonego użytku. Na szczęście prawne walki nie toczą się tylko w USA. Francuskie stowarzyszenie autorów i wydawców książek pozwali Meta, węgierski wydawca pozwał Google za przytaczanie fragmentów artykułów prasowych w Gemini i naruszenie europejskiej dyrektywy dot. jednolitego cyfrowego rynku oraz prawa autorskiego.
Biznes muzyczny wytacza technologiczne działa
Tworzenie algorytmicznie muzyki zaczyna się już w latach 70-tych i od początku wywoływało wiele kontrowersji dotyczących definicji twórczości i aspektów psychologicznych odbioru takich tworów. Nigdy nie było to jednak zagrożenie i konkurencja dla twórców i twórczyń, którzy żyją z komponowania, nagrywania, grania. Dominacja streamingu (i algorytmów) w połączeniu z nowymi narzędziami do generowania muzyki w dowolnym stylu zmieniają tę sytuację.
Na Spotify muzyka wygenerowana przez AI, udająca styl i estetykę prawdziwych wykonawców, pojawia się co najmniej od 2023 roku (ale najprawdopodobniej znacznie dłużej). Spotify zaczął na własną ręką licencjonować od mniej znanych artystów muzykę podobną do tego, co algorytm obserwował jako trendujące w popularności. W kolejnym kroku firma zaczęła skupować licencje do utworów generowanych przez AI. Schemat działa bardzo prosto: AI zespoły i kawałki dodawane są do polecanych playlist, brzmią podobnie do tego, czego użytkownicy słuchają, ale Spotify za taką muzykę nie musi płacić twórcom (lub płaci mniej). W 2025 pojawiają się już wytwórnie, które oferują i promują całkowicie generowaną muzykę i towarzyszące im awatary. Można by uznać to za niegroźny trend związany z tworzeniem muzyki komputerowej (starszej niż AI), gdyby nie dwie podstawowe komplikacje ekonomiczno-prawne:
Tak jak w przykładzie ze Spotify, ale również w przypadku startupów oferujących generowanie utworów muzycznych dla rozrywki i w celach komercyjnych, celem jest dostarczenie muzyki jako usługi bez udziału i wynagrodzenia dla człowieka.
Bark wynagrodzenia dla twórcy to również problem prawny. Współczesne modele generowania muzyki przez AI wykorzystały do nauki istniejące utwory bez żadnej rekompensaty dla twórców i wytwórni (patrz wyżej: dozwolony użytek). To ogromne wyzwanie dla prawa autorskiego i tego jak sądy zinterpretują ten sposób wykorzystania chronionych utworów.
Branża muzyczna przeszła głębsze przeobrażenia technologiczne i ekonomiczne niż wydawcy książkowi i prasowi. Być może to sprawia, że szybciej zaczęła adaptować się do zmian i pracować nad infrastrukturą technologiczną.
Co poza prawem?
Można zacząć zatruwać algorytmy jak muzyk Benn Jordan i badacze z Uniwerystetu Tenesse, którzy pracują nad narzędziem o nazwie Harmony Cloak. To rozwiązanie pozwala na emitowanie muzyki cyfrowej brzmiącej normalnie dla człowieka, ale zawierającej ukryte instrukcje, które powoduje, że algorytm słyszy co innego. W efekcie nie może zaburzyć to proces uczenia się na bazie tego utworu, ale również uruchamiać instrukcje w narzędziach głosowych jak Alexa.
<iframe width="560" height="315" src="
title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
Można zacząć rozwijać narzędzia rozpoznawania muzyki generatywnej, aby lepiej zarządzać redystrybucją zysków dla prawdziwych twórców. Systemy wykrywania implementowane są w różnych elementach produkcji: w narzędziach używanych do trenowania modeli, platformach, na których przesyłane są utwory, bazach danych, które udzielają praw licencyjnych, i algorytmach, które kształtują odkrywanie. Dzięki temu przemysł muzyczny może odróżniać komu płacić, jak licencjonować utwory i jak unikać oszustw. Oznakowywanie utworów generowanych przez AI to nie tylko kwestia licencjonowania, ale też narzędzie przywracające odbiorcom poczucie kontroli i świadomości, co i kogo naprawdę słyszą.
Po drugiej stronie również inwestuje się w technologie. Ostatnio YouTube dodało generatywną muzykę jako opcję podkładów do filmów, a do Shortów narzędzia oparte o model Veo3 od Google (nie wspominając o wpychaniu wszędzie AI tłumaczeń i dubbingu). Tutaj o spór prawny będzie trudniej, ponieważ mało która firma tak dobrze dba o to, aby w swoich warunkach (Terms of service) i regulaminach zabezpieczyć swoje prawa do tworzenia nowych narzędzi na bazie naszych treści. W końcu robią to 20 lat z Gmailem i Google Docs.
Rozwijanie gustu jako nowej formy inteligencji. To hasło staje się coraz popularniejsze wobec ilości treści, które konsumujemy. Masowa produkcja i dystrybucja tworów generowanych przez AI tylko komplikuje sytuacje. Umiejętności rozpoznawania jakości, artyzmu, ludzkiego wkładu, decyzji niewynikających z optymalizacji algorytmicznej stają się ważne nie tylko dla kuratorów i kuratorek. To również coś, co może pomóc nam lepiej i szybciej rozpoznawać AI slop, który będzie stawać się coraz bardziej realistyczny.
Ludzkie polecajki
Książka
The Sympathiser, aut. Viet Thanh Nguyen, to historia podwójnego komunistycznego agenta w Wietnamie, który po upadku Sajgonu zostaje ewakuowany do Stanów Zjednoczonych. Bohater jako migrant jest lepszym obserwatorem amerykanów od nich samych. Jako agent musi być też wyjątkowym obserwatorem siebie, swoich kłamstw i narracji. Wydana też po polsku pt. Sympatyk, ale nie ręczę za tłumaczenie, czytałem po angielsku.
Muzyka
Milton Nascimento - Eu Sou Uma Preta Velha Aqui Sen. Zakochałem się, kiedy to usłyszałem i popłakałem, kiedy przeczytałem tłumaczenie tekstu.
Niamos! (Chandrilian Club Mix) z drugiego sezonu serialu Andor. Bo czasem potrzebujemy rave’u, kiedy wszystko dokoła płonie.
O cześć, dotarliśmy do końca odcinka razem :) Chcesz wesprzeć pisanie kolejnych odcinków, odkrywanie książek i muzyki, rozważ dowolną opcję płatnej subskrypcji. Dzięki!
Jak zawsze - w punkt! Pracowałem z narzędziem do "zatruwania" obrazów i sęk w tym, że wykazywało się naprawdę dużą skutecznością, jak już "zatrucie" było trochę widoczne. Śledzę za to poczynania takie jak Coalition for Content Provenance and Authenticity, ale jeśli duże firmy technologiczne próbuję rozwiązać problem, który sami stworzyli, to zawsze mam wrażenie, że to taki "greenwashing" tylko "tech".