Granice legalnego użycia informacji w dobie AI. Jak daleko można się posunąć z wykorzystaniem danych?
.jpg)
Czy wiesz, że przeciętny użytkownik Internetu zostawia w ciągu dnia ponad 1 000 śladów danych, które mogą zostać użyte do personalizacji ofert, prognozowania zachowań, a nawet treningu sztucznej inteligencji? W erze cyfrowej, w której dane stały się nową walutą, wiele osób zadaje sobie pytanie: jak daleko można się posunąć z wykorzystywaniem danych? Czy każda informacja dostępna w Internecie jest "wolna do użycia"? Gdzie kończy się prawo do innowacji, a zaczyna naruszenie cudzych praw? W tym artykule postaramy się odpowiedzieć na te pytania, analizując zarówno najnowsze orzeczenia, jak i praktyczne przypadki.
Dane jako zasób – szczegółowe regulacje prawne
.jpg)
Wykorzystywanie danych to temat z pogranicza prawa autorskiego, ochrony danych osobowych oraz prawa konkurencji. W zależności od rodzaju danych, inne przepisy mogą mieć zastosowanie:
- Dane osobowe – to wszelkie informacje o zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej (np. imię, adres e-mail, PESEL), regulowane na mocy art. 4 pkt 1 RODO.
- Szczególne kategorie danych osobowych – obejmują m.in. dane dotyczące zdrowia, przekonań religijnych czy orientacji seksualnej, które podlegają dodatkowej ochronie na podstawie art. 9 RODO.
- Dane publiczne – często dostępne, np. w rejestrach państwowych, ale ich wykorzystanie komercyjne może wymagać zgody lub licencji.
- Utwory – to każdy przejaw działalności twórczej o indywidualnym charakterze, ustalony w jakiejkolwiek postaci, niezależnie od wartości, przeznaczenia i sposobu wyrażenia (art. 1 ustawy o prawie autorskim i prawach pokrewnych). Poza dziełami sztuki mogą to być np. dane zawarte w zamkniętych bazach danych, artykuły, raporty – ich kopiowanie i przetwarzanie może naruszać prawa autorskie, nawet jeżeli wydaje się, że opierają się na danych dostępnych publicznie.
Precedensowy wyrok w sprawie Thomson Reuters vs. Ross Intelligence
Dnia 11 lutego2025 roku świat obiegła informacja o wygranej przez Thomson Reuters, będącego kanadyjskim medialnym konglomeratem międzynarodowym w sprawie przeciwko startupowi AI Ross Intelligence, który wykorzystywał zamkniętą bazę danych w ramach własnego systemu informatycznego. System ten korzystał z danych znajdujących się w aplikacji Westlaw, która indeksuje wiele materiałów, które co prawda nie są chronione prawem autorskim (jak np. decyzje prawne), ale są uzupełniane własnymi treściami firmy Thomson Reuters.
Sąd uznał, że przetwarzanie danych objętych licencją bez zgody właściciela stanowiło naruszenie praw autorskich. To orzeczenie stanowi precedens w kontekście wykorzystywania danych przez systemy sztucznej inteligencji, które coraz częściej korzystają z treści pochodzących z zamkniętych źródeł.
Pozew pisarzy przeciwko NVIDIA – Sztuczna inteligencja a prawa autorskie
W 2024 roku trzej pisarze – Brian Keene, Abdi Nazemian i Stewart O'Nan – wnieśli pozew przeciwko firmie NVIDIA, zarzucając jej niezgodne z prawem wykorzystanie ich książek do trenowania modelu sztucznej inteligencji NeMo.
Autorzy twierdzą, że ich utwory były częścią zbioru danych zawierającego około 196 640książek, które pomogły wytrenować NeMo do symulacji zwykłego języka pisanego, zanim zostały usunięte w październiku „z powodu zgłoszonego naruszenia praw autorskich”.
Sprawa przeciwko NVIDIA wciąż jest w toku, a autorzy domagają się odszkodowania za wykorzystanie ich książek do trenowania sztucznej inteligencji bez ich zgody.

Gdzie leży granica fair use, czyli dozwolonego użytku?
Wielu użytkowników Internetu i twórców AI powołuje się na tzw. dozwolony użytek (ang. fair use), jednak:
- W Polsce obowiązuje węższe pojęcie dozwolonego użytku niż w USA. Kwestię tę regulują art. 23-35 ustawy o prawie autorskim i prawach pokrewnych.
- Bez zezwolenia twórcy wolno nieodpłatnie korzystać z już rozpowszechnionego utworu w zakresie własnego użytku osobistego (art. 23 ustawy o prawie autorskim i prawach pokrewnych).
- W kontekście sztucznej inteligencji, dozwolony użytek osobisty nie obejmuje sytuacji, w których dochodzi do komercyjnego, czy nawet niekomercyjnego wykorzystania danych chronionych prawem autorskim. Takie działanie wymaga uzyskania zgody właścicieli praw autorskich lub odpowiedniej licencji.
- Warto wspomnieć, że autor utworu może umożliwić wolne korzystanie z niego poprzez licencję Creative Commons (CC BY).
- Przykładowo, firma meteorologiczna zbiera dane o temperaturze, wilgotności i ciśnieniu atmosferycznym z różnych stacji meteorologicznych. Te dane nie są chronione prawem autorskim, ale firma może chronić swój sposób zbierania i organizowania tych danych (np. unikalny system zbierania danych czy algorytmy przewidywania pogody).
- W kontekście AI trenowanego na treściach chronionych prawem autorskim, pochodzących z zamkniętych baz danych – polskie sądy mogą to uznać za naruszenie prawa.
Praktyczne porady: Jak legalnie korzystać z danych?
· Należy zawsze sprawdzać licencję lub regulamin strony.
· W razie wątpliwości korzystać tylko z danych udostępnionych na licencjach open data (np. Creative Commons).
· Powinno się gromadzić i przetwarzać dane osobowe tylko zgodnie z RODO i po spełnieniu obowiązków i jak daleko można się posunąć z wykorzystaniem danych? Granice legalnego użycia informacji w dobie AInformacyjnych.
· Powinno się unikać „scrapowania” danych z zamkniętych systemów bez zgody właściciela, nawet jeśli wydaje się, że ta baza zawiera tylko dane dostępne publicznie.
Jakie dane może wykorzystywać AI?
· Danegenerowane przez AI – jeżeli AI tworzy dane na podstawie istniejących danych twórczość wygenerowana przez AI nie jest utworem, gdyż AI nie może być twórcą. Jednak wystarczająco indywidualny sposób ułożenia czy przekształcenia tych danych przez człowieka może podlegać ochronie.
· Dane publiczne – dostępne w otwartych bazach danych, nieprzetworzone w sposób indywidualny.
· Dane osobowe - tylko wtedy, gdy są one anonimizowane lub pseudonimizowane, co oznacza, że nie można zidentyfikować osoby fizycznej na podstawie tych danych.

Przyszłość danych i AI – nadchodzące regulacje
W związku z dynamicznym rozwojem AI, Unia Europejska pracuje nad AI Act, który będzie regulować m.in. legalność wykorzystywania danych do trenowania modeli.
Przewidziano m.in.:
· Ujawnienie, faktu, że dana treść (zdjęcie, grafika, tekst, wideo) została wygenerowana przez sztuczną inteligencję.
· Zaprojektowanie modelu w taki sposób, by nie tworzył nielegalnych treści.
- Udostępnienie informacji o chronionych prawem autorskim danych wykorzystywanych do szkolenia systemów sztucznej inteligencji
- Kary administracyjne za naruszenia.
- Na chwilę obecną AI Act nie obowiązuje w całości. Kolejne przepisy rozporządzenia wejdą w życie od dnia 2 sierpnia 2025 r.
Jak bezpiecznie korzystać z danych?
Legalne wykorzystanie danych wymaga:
- Znajomości podstaw prawa autorskiego i ochrony danych,
- Weryfikowania źródeł i ich statusu prawnego,
- Ostrożności przy tworzeniu i trenowaniu AI.
Granica między legalnym użyciem danych, a ich nieuprawnionym kopiowaniem jest cienka – ale coraz wyraźniej rysowana przez sądy i regulatorów. Warto trzymać się zasad, bo ryzyko kar finansowych, procesów sądowych i utraty reputacji jest dziś realne.
Źródła:
https://www.ey.com/pl_pl/insightsx/law/unijny-akt-w-sprawie-sztucznej-inteligencji-zasady-przetwarzania-danych-osobowych-instytucje-finansowych-ai-fy24
https://itreseller.pl/nvidia-pozwana-przez-autorow-w-zwiazku-z-wykorzystaniem-przez-ai-dziel-chronionych-prawem-autorskim/
https://kancelaria-mp.pl/ai-act-a-prawa-autorskie-i-pokrewne/
https://www.ppe.pl/news/338066/nvidia-na-celowniku-firma-pozwana-za-naruszenie-praw-autorskich-w-technologii-ai.html
https://lexdigital.pl/sztuczna-inteligencja
https://www.iwp.pl/thomson-reuters-wygrywa-w-sadzie-ze-startupem-ai-sprawe-dotyczaca-praw-autorskich/
https://delante.pl/ai-a-prawa-autorskie/
AI Act: https://www.europarl.europa.eu/RegData/etudes/BRIE/2021/698792/EPRS_BRI(2021)698792_EN.pdf
Ustawa z dnia 4lutego 1994 r. o prawie autorskim i prawach pokrewnych (t.j. Dz.U.2025.24)
RozporządzenieParlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. wsprawie ochrony osób fizycznych w związku z przetwarzaniem danych osobowych i wsprawie swobodnego przepływu takich danych oraz uchylenia dyrektywy 95/46/WE(ogólne rozporządzenie o ochronie danych) (RODO)
Premiera już 9 czerwca 2025
Kontakt
Dowiedz się więcej
Infolinia 24h