404 Media avslöjar nu Nvidias dataskrapande och datainsamlande ute på nätet – utan medgivande av de som skapat informationen – allt för att kunna hänga med i konkurrensen med AI-lösningar.
4040 media har kommit över interna meddelanden, loggar från Slack och interna dokument som avslöjar och som visar hur anställda inom Nvidia uppmanades att samla in data från Youtube, Netflix och andra källor. Data som krävdes för att kunna träna de egna AI-lösningarna och för att hänga med i vad som har utvecklats till en närmast mördande konkurrens, allt i skuggan av att NVidias aktie gått som en börsraket.
Rekordhögt värde
Nvidia har idag flera AI-produkter, förutom hårdvara och det är det senare som gjort att bolaget idag har ett rekordhögt värde på börsen. Nvidia har idag Omniverse 3D world generator, lösningar för självkörande bilar och det som kallas “digital human”products”, chatbottar som liknar mänskligt beteende.
Nvidia är även inne i utvecklingsfasen av Cosmos, vilket beskrivs som en toppmodern videomodell:
”som kapslar in simulering av ljustransport, fysik och intelligens på ett ställe för att låsa upp olika nedströmsapplikationer som är viktiga för NVIDIA .”
För att träna denna nya videomodell krävs enorma mängder data – enorma mängder videor.
Pipeline
I maj i år så skriver Ming-Yu Liu, som leder Cosmos-projektet:
”Vi slutför v1-datapipelinen och säkrar de nödvändiga datorresurserna för att bygga en videodatafabrik som kan ge en visuell upplevelse för en mänsklig livslängd värd träningsdata per dag.”
Denna pipeline var i själva verket en avancerad lösning för att kopiera och ladda ned enorma mängder videor utan att Netflix och Youtube skulle upptäcka det och blockera datainsamlingen. Epost som 4040 Media fått se innehåller diskussioner inom projektet där det sägs att lösningen, Nvidias egen pipeline, skulle kunna ladda ned motsvarande 80 år med videor, per dag.
Vid samtal med Youtube så säger videotjänsten att det inte finns några avtal där Nvidia ges rätten att förse sig av innehållet, ladda ned videor. Trots det så anser Nvidia att deras datainsamlande håller sig inom regelverket.
“We respect the rights of all content creators and are confident that our models and our research efforts are in full compliance with the letter and the spirit of copyright law,”
0 kommentarer