Баг в AMD EPYC Rome отправляет процессоры в отпуск через 34 месяца работы
Компания AMD опубликовала уведомление о том, что второе поколение процессоров EPYC, которое использует архитектуру Zen2, столкнулось с отправляющим "камни" в сон багом. Суть происходящего заключается в том, что после 1044 дней работы ядра не справляются с выходом из состояния CC6. Стоит уточнить, что проблема возникает именно через 1044 дня с последнего перезапуска системы.
Что же до причины проблемы, то она возникает из-за CPU REFCLK, которая спустя 1044 дня насчитывает больше 9 квадриллионов циклов, что перегружает буфер и отправляет ядра процессора в состояние "зомби", в котором они не реагируют на внешние команды.
Удивительно, что эта проблема вообще была обнаружена, все же для такого процессора в чьих-то системах необходимо было работать почти 3 года вообще без перезагрузок. Для решения этой проблемы AMD порекомендовали всем отключить CC6 в их EPYC Rome или просто перезагружать системы раз в некоторое время.