Nyligen offentliggjorda brev (mail) visar att Meta tränat sina AI-lösningar på piratkopierade böcker och att det handlar om mycket stora mängder som laddats ned, i storleksordningen närmare 82 terabytes.
Meta har erkänt att de att har laddat ned ett arkiv, LibGen, som inkluderar tiotals miljoner piratkopierade böcker men omfattningen och hur hur Meta har använt upphovsrättsligt skyddade böcker för att träna sina olika AI-lösningar har inte varit kända, förrän nu.
I don’t think we should use pirated material. I really need to draw a line there.
Nu har interna mail, inifrån Meta, offentliggjorts då den grupp av författare som stämt Meta har lagt fram sin bevisning och utredning inför domstolen.
”minst 81,7 terabyte data över flera skuggbibliotek genom sajten Anna’s Archive, inklusive minst 35,7 terabyte data från Z-Library och LibGen”
Meta har laddat ned informationen med Torrent-protokollet vilket innebär att Meta inte bara har laddat ned piratkopierade böcker utan även medverkat till att böckerna har kunnat spridas vidare. Torrent-protokollet innebär att, samtidigt som du laddar ned data, så hjälper du också till att dela data, skicka samma data vidare till andra.
Ifrågasatt
Can we load libgen data using Meta IP ranges? Or should we use some vpn?
Av alla de interna brev som nu har offentliggjorts så framgår det också att hanteringen av piratkopior inom Meta inte varit okontroversiell. Flera anställda som jobbat med AI-lösningarna har ifrågasatt det etiska, moraliska och lagliga i att träna AI-lösningar med piratkopierade, olagliga kopior.
Torrenting from a corporate laptop doesn’t feel right.
Författarna som stämt Meta menar att den nu offentliggjorda kommunikationen inte bara visar att meta använt sig av piratkopior utan att ordern att göra det kom ända uppifrån toppen av Meta, vilket involverar Mark Zuckerberg.
Här kan du läsa inlagan till domstolen (pdf)
Dölja
Enligt författarnas uppgifter så har Meta försökt att dölja var informationen skickades ifrån när de piratkopierade böckerna laddades ned genom att se till att Facebooks servrar inte dök upp i informationen i torrentströmmarna.
Meta å sin sida har bestridit att böcker spridits vidare och hävdar:
”kärandena åberopar inte ett enda fall där någon del av någon bok i själva verket laddades ner av en tredje part från Meta via torrent, än mindre att målsägandens böcker på något sätt distribuerades av Meta.”