Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc
Умный суперсемплинг, Рей-трейсинг в видеокартах и 19% рост IPC в процессорах
Новые процессоры Alder Lake сочетают полноценные мощные ядра с маленькими энергоэффективными и сегодня Intel поделились подробностями о принципах работы новых гибридных процессоров. Новые гибридные процессоры и многочисленные оптимизации Intel позволят повысить IPC (Instructions Per Clock) за счет нескольких факторов, включая:
- Кэш подсистемы предсказания ветвлений на 5 тысяч записей для более точного результата;
- 64-килобайтный кэш инструкций оптимизирован хранить наиболее частые инструкции ближе, не обращаясь к внешней памяти;
- Первый декодер длины инструкций Intel, который производит предварительную информацию для запроса;
- Кластеризованный внеочередной (out-of-order) декодер, который позволяет декодировать до 6 инструкций за такт с сохранением уровня энергоэффективности;
- Расширенный исполнительный модуль с 5 регистрами переназначения и 8 регистрами завершения инструкций, буфером на 256 внеочередных инструкций и 17 исполнительными портами;
- Надежные функции безопасности, включая аппаратную защиту от кибератак Intel® Control- Flow Enforcement Technology (CET) и защиту от перенаправлений Intel® Virtualization Technology;
- Реализация расширения системы команд AVX наряду с новыми дополнениями для поддержки целочисленных операций ИИ.
В сравнении с ядром Skylake, в сингл-треде энергоэффективное ядро Alder Lake предоставляет на 40% больше производительности при одинаковом энергопотреблении, или аналогичную производительность при уменьшенном на 40% энергопотреблении. Четыре энергоэффективных ядра без использования технологии Hyper Threading имеют производительность на 80% выше, чем 2 ядра и 4 потока Skylake, потребляя при этом меньше энергии или схожую производительность при использовании лишь 20% энергии от Skylake.
Производительные ядра Alder Lake, ранее известные как Golden Cove спроектированы для уменьшения задержек и высокой производительности в сингл-треде. Новые производительные ядра обеспечивают большой скачок в производительности и лучшую приложений с большим объемом кода.
Архитектура производительных ядер расширилась в следующих направлениях:
- Шире: 6 декодеров (ранее 4), кэш на 8 микроопераций (ранее до 6), 6 портов переименования/распределения (ранее 5), 12 исполнительных портов (ранее 10);
- Глубже: больше файлы регистров, больше файлы физических регистров, более глубокий буфер переупорядочивания инструкций на 512 записей;
- Эффективнее: повышенная точность предсказания ветвлений, уменьшенная эффективная латентность кэша L1, полная предикативная оптимизация записи кэша L2.
В сочетании с другими оптимизациями и нововведениями Intel обещают:
- Рост производительности до 19% при тестах на большом количестве популярных приложений по сравнению с архитектурой Intel® Core™ 11-го поколения (Cypress Cove) при сравнимой тактовой частоте (общий показатель роста считается как среднее геометрическое);
- Упор на параллелизм и наращивание исполнительного параллелизма;
- Расширения Intel® Advanced Matrix – встроенные средства ускорения ИИ нового поколения, предназначенные для инференса глубокого обучения и повышения эффективности обучения. Они включают выделенные аппаратные модули и новую архитектуру набора инструкций для значительного ускорения операций перемножения матриц;
- Оптимизации работы с приложениями, имеющими большой объем данных и кода, в том числе c точки зрения уменьшения задержек.
Раджа Кодури рассказал о новой графике Intel Arc и первом поколении производительных дискретных решений под кодовым названием Alchemist.
SoC Alchemist на базе микроархитектуры Xe HPG спроектированы для обеспечения высокой масштабируемости и вычислительной эффективности со следующими ключевыми возможностями:
- До 8 слоев рендеринга с фиксированной функцией для DirectX 12 Ultimate;
- Новые ядра Xe с 16 векторными и 16 матричными движками (называемыми XMX – Xe Matrix eXtensions), кэшем и общей локальной памятью;
- Новые модули трассировки лучей с поддержкой технологий DirectX Raytracing (DXR) и Vulkan Ray Tracing;
- Увеличение частоты в 1,5 раза и соотношения производительности на ватт в 1,5 раза по сравнению с микроархитектурой Xe LP за счет сочетания новой архитектуры, логического построения, схемотехники, технологии производства и оптимизации программного обеспечения1;
- Производство с нормами технологического процесса TSMC N6.
При разработке графики Intel использует подход, ориентированный на программное обеспечение:
- Архитектура Xe создается в тесном сотрудничестве с разработчиками в соответствии с отраслевыми стандартами;
- Первый высокопроизводительный игровой графический процессор Intel ставит во главу производительность и качество благодаря разработке драйвера с единым унифицированным исходным кодом для интегрированных и дискретных графических продуктов;
- Intel завершила рефакторинг ключевых компонентов графического драйвера, в том числе диспетчера памяти и компилятора, что привело к повышению производительности в процессорозависимых играх до 18% и уменьшению времени загрузки игры до 25%.
Технология XeSS
XeSS использует преимущество реализованных в Alchemist ускорителей ИИ для новой технологии масштабирования, которая обеспечивает высокую производительность и высокое качество изображения. Технология использует глубокое обучение для синтеза изображений, близких по качеству к рендерингу с высоким разрешением. Благодаря XeSS, игры, в которые можно играть только при низких настройках качества или разрешения, могут демонстрировать плавный игровой процесс с более высокими настройками качества и разрешения.
- Работа XeSS заключается в реконструкции деталей на субпиксельном уровне из соседних пикселей, а также из предыдущих кадров с компенсацией движения;
- Реконструкцию выполняет нейронная сеть, обученная обеспечивать высокую производительность и качество, с увеличением производительности в 2 раза;
- XeSS обеспечивает суперсэмплинг на базе ИИ с помощью набора инструкций DP4a на широком списке оборудования, включая интегрированную графику;
- Несколько разработчиков игр задействованы в работе над XeSS. SDK для первой версии XMX будет доступен независимым разработчикам программного обеспечения уже в этом месяце, а версия с DP4a будет доступна позже в этом году.