NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4320
9

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
С декабря нельзя будет даже статистику о VPN публиковать, как и любую другую информацию
С декабря нельзя будет даже статистику о VPN публиковать, как и любую другую информацию
Роскомнадзор продолжает свою войну против сервисов обхода блокировок. С 30 ноября в России будет запрещена любая научная, научно-техническая, статистическая и иная информация о VPN. Но есть одно исключение.
Вчера в 17:07
2937
38
Форум
Данные всех граждан России давно слиты в "Даркнет"
Данные всех граждан России давно слиты в "Даркнет"
Если вы по наивности своей переживаете за сохранность личных данных в интернете, то лишь напрасно тратите нервные клетки.
19 ноября в 18:26
3810
25
Форум
Новая ИИ-реклама Coca-Cola вызвала ярость у зрителей
Новая ИИ-реклама Coca-Cola вызвала ярость у зрителей
Компания Coca-Cola получила негативную реакцию в Интернете после появления рождественской рекламы, созданной искусственным интеллектом, которую назвали «жутким антиутопическим кошмаром».
16 ноября в 14:58
6062
22
Форум