Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

Умный суперсемплинг, Рей-трейсинг в видеокартах и 19% рост IPC в процессорах

9469
8

Новые процессоры Alder Lake сочетают полноценные мощные ядра с маленькими энергоэффективными и сегодня Intel поделились подробностями о принципах работы новых гибридных процессоров. Новые гибридные процессоры и многочисленные оптимизации Intel позволят повысить IPC (Instructions Per Clock) за счет нескольких факторов, включая:

  • Кэш подсистемы предсказания ветвлений на 5 тысяч записей для более точного результата;
  • 64-килобайтный кэш инструкций оптимизирован хранить наиболее частые инструкции ближе, не обращаясь к внешней памяти;
  • Первый декодер длины инструкций Intel, который производит предварительную информацию для запроса;
  • Кластеризованный внеочередной (out-of-order) декодер, который позволяет декодировать до 6 инструкций за такт с сохранением уровня энергоэффективности;
  • Расширенный исполнительный модуль с 5 регистрами переназначения и 8 регистрами завершения инструкций, буфером на 256 внеочередных инструкций и 17 исполнительными портами;
  • Надежные функции безопасности, включая аппаратную защиту от кибератак Intel® Control- Flow Enforcement Technology (CET) и защиту от перенаправлений Intel® Virtualization Technology;
  • Реализация расширения системы команд AVX наряду с новыми дополнениями для поддержки целочисленных операций ИИ.

В сравнении с ядром Skylake, в сингл-треде энергоэффективное ядро Alder Lake предоставляет на 40% больше производительности при одинаковом энергопотреблении, или аналогичную производительность при уменьшенном на 40% энергопотреблении. Четыре энергоэффективных ядра без использования технологии Hyper Threading имеют производительность на 80% выше, чем 2 ядра и 4 потока Skylake, потребляя при этом меньше энергии или схожую производительность при использовании лишь 20% энергии от Skylake.

Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

Производительные ядра Alder Lake, ранее известные как Golden Cove спроектированы для уменьшения задержек и высокой производительности в сингл-треде. Новые производительные ядра обеспечивают большой скачок в производительности и лучшую приложений с большим объемом кода.

Архитектура производительных ядер расширилась в следующих направлениях:

  • Шире: 6 декодеров (ранее 4), кэш на 8 микроопераций (ранее до 6), 6 портов переименования/распределения (ранее 5), 12 исполнительных портов (ранее 10);
  • Глубже: больше файлы регистров, больше файлы физических регистров, более глубокий буфер переупорядочивания инструкций на 512 записей;
  • Эффективнее: повышенная точность предсказания ветвлений, уменьшенная эффективная латентность кэша L1, полная предикативная оптимизация записи кэша L2.

В сочетании с другими оптимизациями и нововведениями Intel обещают:

  • Рост производительности до 19% при тестах на большом количестве популярных приложений по сравнению с архитектурой Intel® Core™ 11-го поколения (Cypress Cove) при сравнимой тактовой частоте (общий показатель роста считается как среднее геометрическое);
  • Упор на параллелизм и наращивание исполнительного параллелизма;
  • Расширения Intel® Advanced Matrix – встроенные средства ускорения ИИ нового поколения, предназначенные для инференса глубокого обучения и повышения эффективности обучения. Они включают выделенные аппаратные модули и новую архитектуру набора инструкций для значительного ускорения операций перемножения матриц;
  • Оптимизации работы с приложениями, имеющими большой объем данных и кода, в том числе c точки зрения уменьшения задержек.

Раджа Кодури рассказал о новой графике Intel Arc и первом поколении производительных дискретных решений под кодовым названием Alchemist.

Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

SoC Alchemist на базе микроархитектуры Xe HPG спроектированы для обеспечения высокой масштабируемости и вычислительной эффективности со следующими ключевыми возможностями:

  • До 8 слоев рендеринга с фиксированной функцией для DirectX 12 Ultimate;
  • Новые ядра Xe с 16 векторными и 16 матричными движками (называемыми XMX – Xe Matrix eXtensions), кэшем и общей локальной памятью;
  • Новые модули трассировки лучей с поддержкой технологий DirectX Raytracing (DXR) и Vulkan Ray Tracing;
  • Увеличение частоты в 1,5 раза и соотношения производительности на ватт в 1,5 раза по сравнению с микроархитектурой Xe LP за счет сочетания новой архитектуры, логического построения, схемотехники, технологии производства и оптимизации программного обеспечения1;
  • Производство с нормами технологического процесса TSMC N6. 

При разработке графики Intel использует подход, ориентированный на программное обеспечение:

  • Архитектура Xe создается в тесном сотрудничестве с разработчиками в соответствии с отраслевыми стандартами;
  • Первый высокопроизводительный игровой графический процессор Intel ставит во главу производительность и качество благодаря разработке драйвера с единым унифицированным исходным кодом для интегрированных и дискретных графических продуктов;
  • Intel завершила рефакторинг ключевых компонентов графического драйвера, в том числе диспетчера памяти и компилятора, что привело к повышению производительности в процессорозависимых играх до 18% и уменьшению времени загрузки игры до 25%.

Технология XeSS

XeSS использует преимущество реализованных в Alchemist ускорителей ИИ для новой технологии масштабирования, которая обеспечивает высокую производительность и высокое качество изображения. Технология использует глубокое обучение для синтеза изображений, близких по качеству к рендерингу с высоким разрешением. Благодаря XeSS, игры, в которые можно играть только при низких настройках качества или разрешения, могут демонстрировать плавный игровой процесс с более высокими настройками качества и разрешения.

  • Работа XeSS заключается в реконструкции деталей на субпиксельном уровне из соседних пикселей, а также из предыдущих кадров с компенсацией движения;
  • Реконструкцию выполняет нейронная сеть, обученная обеспечивать высокую производительность и качество, с увеличением производительности в 2 раза;
  • XeSS обеспечивает суперсэмплинг на базе ИИ с помощью набора инструкций DP4a на широком списке оборудования, включая интегрированную графику;
  • Несколько разработчиков игр задействованы в работе над XeSS. SDK для первой версии XMX будет доступен независимым разработчикам программного обеспечения уже в этом месяце, а версия с DP4a будет доступна позже в этом году.
Другие публикации по теме
Так выглядит спасение от горящих 16-pin на видеокартах NVIDIA RTX
Так выглядит спасение от горящих 16-pin на видеокартах NVIDIA RTX
Пользователь Bilibili Uniko's Hardware опубликовал возможное решение для всех проблем коннекторов 16-pin у видеокарт NVIDIA GeForce RTX 4090 и 5090.
Вчера в 16:08
3444
12
Форум
AMD RX 9060 XT выйдет на охоту за RTX 4070 во втором квартале 2025 года
AMD RX 9060 XT выйдет на охоту за RTX 4070 во втором квартале 2025 года
Видеокарты AMD Radeon RX 9060 XT будут доступны в продаже когда-то во втором квартале 2025 года.
2 марта в 17:30
3152
10
Форум
Ваша NVIDIA RTX 5080 может быть медленнее, чем RTX 4080S — потерянные ROP отнимают до 11% производительности
Ваша NVIDIA RTX 5080 может быть медленнее, чем RTX 4080S — потерянные ROP отнимают до 11% производительности
NVIDIA изначально не хотела это признавать, но видеокарты RTX 5080 также имеют проблемы с браком чипов, который приводит к потере восьми ROP.
2 марта в 15:04
7393
19
Форум