NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4784
9
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
23% зрителей вообще игнорируют фильмы и сериалы Disney из-за повестки
23% зрителей вообще игнорируют фильмы и сериалы Disney из-за повестки
Портал Rasmussen Reports провел опрос среди своей аудитории, в котором поинтересовался, как влияет навязывание повестки на успехи или провалы медиапродуктов компании Disney.
13 января в 16:56
4157
37
Форум
“ВКонтакте”, "Авито" и другие российские ресурсы попали в ежегодный список пиратских сайтов американского регулятора
“ВКонтакте”, "Авито" и другие российские ресурсы попали в ежегодный список пиратских сайтов американского регулятора
Торговое представительство США в очередной раз включило в ежегодный список площадок с нелегальным контентом несколько российских сервисов, включая популярную социальную сеть “ВКонтакте”.
13 января в 16:49
2977
26
Форум
Депутат Горелкин: "никаких запретов на деятельность иностранных площадок законопроект не содержит”, но есть важный нюанс
Депутат Горелкин: "никаких запретов на деятельность иностранных площадок законопроект не содержит”, но есть важный нюанс
Депутат Антон Горелкин на своем “Телеграм”-канале прокомментировал ситуацию с грядущим законом, который, по логике депутатов, должен защитить детей от “негативного влияния видеоигр”.
10 января в 15:15
8350
68
Форум