Njemački okružni sud nedavno je odlučio da kopiranje slika radi stvaranja skupa podataka koji se potencijalno mogu koristiti za obuku sustava generativne umjetne inteligencije (AI) ne krši njemački zakon o autorskim pravima. Robert Kneschke v. Large Scale Artificial Intelligence Open Network, slučaj br. GRUR-RS 2024, 25458 (Okružni sud u Hamburgu, 27. rujna 2024.)
Neprofitna organizacija Large Scale Artificial Intelligence Open Network (LAION) stvorila je skup podataka koji sadrži 5,85 milijardi slika s tekstom koje su javno dostupne na internetu. Ovaj skup podataka može se koristiti za obuku generativnih AI sustava. Za stvaranje skupa podataka, LAION je pristupio postojećem skupu podataka s jedinstvenim lokatorima resursa (URL-ovima) koji upućuju na slike i njihove opise. Najprije je LAION izvukao URL-ove i preuzeo navedene slike, uključujući djelo zaštićeno autorskim pravima fotografa Roberta Kneschkea, iako je na podstranici web-mjesta bila navedena zadrška korištenja protiv "scrapinga" weba. LAION je analizirao opise slika pomoću softverske aplikacije. Aplikacija je isključila parove slika-tekst gdje se sadržaj teksta i slike nije dovoljno podudarao. LAION je svom rudarenju podataka dodao samo potvrđene slike s opisom.
Robert Kneschke podigao je tužbu za kršenje autorskih prava na temelju preuzimanja njegovih slika od strane LAION-a.
Sud je smatrao da su postupci LAION-a bili opravdani i u skladu s člankom 60d(1) njemačkog Zakona o autorskim i srodnim pravima (UrhG) – iznimka znanstvenog istraživanja.
Odjeljak 60 d (1) dopušta organizacijama ponovnu uporabu teksta i rudarenja podataka u znanstvene svrhe. Njemački sud pojasnio je da je stvaranje skupa podataka ustvari rudarenje podataka, čak i ako je svrha stvaranja bila obuka umjetne inteligencije. Kako je objasnio okružni sud, analiza slike radi usporedbe s postojećim opisom je analiza u svrhu dobivanja informacija. Okružni sud smatrao je da se čak i stvaranje skupa podataka, koji bi mogao biti temelj za obuku sustava umjetne inteligencije, treba smatrati znanstvenom svrhom (tj. aktivnošću u potrazi za novim znanjem bez obzira na neposredno stjecanje znanja ili kasniji uspjeh u istraživanju). Utvrđeno je da je stvaranje skupa podataka temeljni korak u svrhu korištenja skupa podataka za kasnije stjecanje znanja. Treba napomenuti da je skup podataka objavljen besplatno i tako također dostupan onima koji se bave umjetnom inteligencijom. Prema njemačkom sudu, budući da je obuka i razvoj sustava umjetne inteligencije (čak i od strane komercijalnih poduzeća) još uvijek znanstveno istraživanje, bilo je irelevantno da skup podataka mogu dodatno koristiti komercijalna poduzeća za obuku ili razvoj svojih sustava umjetne inteligencije.
Praktična napomena: Ova će presuda imati implikacije na pozivanje na autorska prava kao prepreke obuci sustava umjetne inteligencije.