NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4865
9
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
“Заблокировано — и точка” — новое шоу от Роскомнадзора, где хвалятся банами "запрещенки" в Сети
“Заблокировано — и точка” — новое шоу от Роскомнадзора, где хвалятся банами "запрещенки" в Сети
Главная причина жжения пониже спины у потребителей интернета в России, регулятор “Роскомнадзор”, запустил видеоподкаст “Заблокировано — и точка”.
1 апреля в 10:35
7280
24
Форум
С Google в России взыскали более 13 миллиардов рублей штрафов, но это лишь 40%
С Google в России взыскали более 13 миллиардов рублей штрафов, но это лишь 40%
Федеральная служба судебных приставов (ФССП) России взыскала с ООО «Гугл» (дочки Google в РФ) 13,4 млрд рублей — 40% от общей суммы штрафов за нарушения законов РФ, сообщили «Известиям» в Роскомнадзоре. Всего Google LLC оштрафовали на 32,8 млрд рублей, из которых 19,5 млрд остаются неоплаченными, уточнили в ведомстве.
21 марта в 13:58
8686
18
Форум
[18+] Хэштег "Грудь Под Книгой" набирает популярность в X, а мы и не против
[18+] Хэштег "Грудь Под Книгой" набирает популярность в X, а мы и не против
В социальных сетях вновь набирает популярность необычный флешмоб, изначально известный как Underboob Challenge.
20 марта в 17:55
17495
19
Форум