Apple tränade sin AI-lösning på data från Youtube, utan tillstånd

av Mikael Winterkvist | jul 17, 2024 | Bluesky, Mastodon, Nyheter, Threads

AI-modeller som utvecklas av Apple, Salesforce, Anthropic och andra stora aktörer har tränats på tiotusentals YouTube-videor utan skaparnas samtycke och potentiellt i strid med YouTubes villkor, enligt en ny rapport som publicerats av Proof News och Wired.

Företagen tränade sina modeller delvis genom att använda ”the Pile”, en insamling av data som gjorts av av ideella EleutherAI. Datasamlingening var tänkt att kunna användas av individer eller företag som inte har resurserna att konkurrera med de stora techbolagen. I efterhand har det visat sig att även de stora aktörerna har använt sig av samma datasamling för sina AI-lösningar.

Indirekt

Informationen har använts indirekt då Apple, Salesforce med flera inte själva har samlat in alla data som inkluderar böcker, Wikipedia-artiklar och mycket mer. Det inkluderar YouTube-textning som samlats in av YouTubes captions API, skrapad från 173 536 YouTube-videor från mer än 48 000 kanaler. Det inkluderar videor från stora YouTubers som MrBeast, PewDiePie och den populära teknikkommentatorn Marques Brownlee. Brownlee har kommenterat Apples användning av informationen och konstaterade att frågan inte är helt enkel då informationen samlats in av andra.

Apple has sourced data for their AI from several companies

One of them scraped tons of data/transcripts from YouTube videos, including mine

Apple technically avoids ”fault” here because they’re not the ones scraping

But this is going to be an evolving problem for a long time https://t.co/U93riaeSlY

— Marques Brownlee (@MKBHD) July 16, 2024

Ars Technica

0 kommentarer

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

De senaste inläggen:

« Äldre inlägg

Apple tränade sin AI-lösning på data från Youtube, utan tillstånd

AI-modeller som utvecklas av Apple, Salesforce, Anthropic och andra stora aktörer har tränats på tiotusentals YouTube-videor utan skaparnas samtycke och potentiellt i strid med YouTubes villkor, enligt en ny rapport som publicerats av Proof News och Wired.

Indirekt

0 kommentarer

Mikael Winterkvist

De senaste inläggen:

Nej, det här är inte iPhone 17 Pro Max

Gratis är gott: Keyboard Cowboy – öppna filer och appar snabbare

Så här använde säkerhetsforskare AI för ett genomföra en nätfiskeattack