Британская Arm представила новую платформу для чипсетов мобильных устройств — Arm Total Compute Solutions 2023 (TCS23), и тайваньская MediaTek уже заявила, что намерена её использовать в продуктах следующего поколения. В платформу входят новые вычислительные ядра Cortex-X4, Cortex-A720, Cortex-A520 с архитектурой Armv9.2 и графические ядра Immortalis-G720, Mali-G720 и Mali-G620.
Согласно концепции TCS23 процессорный кластер может содержать до 14 ядер, включая ядра трех типов: производительные, ядра среднего уровня и энергоэффективные. Производительное ядро в этой группе — Cortex-X4, роль среднего ядра выполняет Cortex-A720, а энергоэффективного — Cortex-A520. В TCS23 все они стали 64-битными. При этом последние два в этом списке традиционно выполняют роли «большого» и «маленького» ядер в архитектуре Arm big.LITTLE. Но теперь она больше похожа на big.big.LITTLE, поскольку в комплекте будет и производительное ядро X4.
Arm сообщила, что благодаря улучшению энергоэффективности Cortex-A720 лицензиаты её архитектуры смогут использовать больше ядер среднего уровня и меньше ядер малой эффективности, чем раньше. Другими словами, в кластере можно будет использовать A720 в качестве основных рабочих лошадок, крупный и энергоемкий X4 для ресурсоемких задач и небольшое количество малых A520 для выполнения экономичной фоновой работы.
Таким образом, хотя типичной конфигурацией является один X4, три A720 и четыре A520, некоторые клиенты смогут собирать комплексы с формулой 1+5+2 в зависимости от предполагаемых рабочих нагрузок и энергопотребления.
Как говорит Arm, Cortex-X4 это «самый быстрый её процессор из когда-либо созданных». Он может похвастать ростом производительности на 15 % по сравнению с предыдущим поколением, потребляя при этом на 40 % меньше энергии. Также Cortex-X4 получил увеличенный L2-кеш объемом 2 Мбайт. Но рост производительности происходит не только за счёт него, но и за счет усовершенствований в выборке инструкций. Arm говорит, что Cortex-X4 может быть изготовлен, например, по 3-нм техпроцессу N3E компании TSMC, что дает представление о том, в каких решениях можно будет увидеть это процессорное ядро.
Усовершенствования затронули и другие ядра. У средних ядер Cortex-A720 по сравнению с прошлогодними Cortex-A715 произошёл 20-процентный рост энергоэффективности при той же производительности (или производительности при том же уровне энергопотребления), благодаря более быстрому восстановлению конвейера после ошибочного предсказания ветвлений, а также уменьшению задержки при обращениях к кэшу L2.
Cortex-A520, в свою очередь, предлагает на 8 % более высокую производительность и на 22 % меньшее энергопотребление по сравнению с прошлогодним Cortex-A510. Cortex-A520 имеет наименьшую электрическую мощность и площадь среди ядер Armv9.2 и основан на микроархитектуре объединенных ядер, где два ядра совместно используют кеш L2. Кроме того, для снижения энергопотребления в Cortex-A520 удалены некоторые функции, например, третий конвейер ALU.
Ожидаемые тактовые частоты лежат в окрестности 4 ГГц для Cortex-X4, от 2,5 ГГц до 3 ГГц для Cortex-A720, и от 2 ГГц до 1,5 ГГц для Cortex-A520.
Предложенный Arm новый объединённый ядерный кластер DSU-120 теперь имеет поддержку до 32 Мбайт общего кэша L3, а также новые режимы питания, помогающие снизить токи утечки. Например, он получил возможность переводить память в состояние пониженного энергопотребления, когда ядра процессора простаивают. Кроме того, DSU-120 позволяет создавать более гибкие конфигурации ядер с любой комбинацией Cortex-X4, Cortex-A720 или Cortex-A520, включая даже конфигурации с десятью Cortex-X4 и четырьмя Cortex-A720, которые подойдут для ноутбуков.
Что касается графики, то в составе TCS23 представлена архитектура Arm пятого поколения. Решения на её основе включают в себя Immortalis-G720, Mali-G720 и Mali-G620. Эти GPU имеют фактически одинаковый дизайн, разница заключается в количестве шейдерных ядер, которые выбирают лицензиаты. Mali-G620 имеет пять ядер или меньше, Mali-G720 — от шести до девяти ядер, а Immortalis-G720 — более 10 ядер (с верхним пределом в 16 ядер). Кроме того, что Immortalis должен включать аппаратный блок трассировки лучей.
Основное обновление в этом поколении графики — Deferred Vertex Shading (DVS). Это означает, что большая часть тяжелой работы по рендерингу откладывается до окончания обработки геометрии, после чего все скрытые поверхности могут быть отброшены, а не отрисованы. Arm заявила, что это было реализовано, чтобы справиться с растущей сложностью сцен в играх, и сделать возможным запуск на мобильных устройствах 3D-приложений следующего поколения. Еще одним плюсом DVS является то, что для работы требуется на 40 % меньше пропускной способности памяти, а это ведет к экономии энергии: новые GPU должны быть в среднем на 15 % более энергоэффективными, чем предыдущее поколение. В то же время Arm заявляет о 15-процентном увеличении пиковой производительности по сравнению с предыдущим поколением, но не сравнивает свои новые GPU ни с какими конкурентами.
Следует помнить, что Arm не производит свои собственные чипы, поэтому платформа TCS23 в конечном итоге появится в конечных решениях лицензиатов. Arm ожидает появления продуктов нового поколения на рынке в начале следующего года. Первой компанией, заявившей о намерении перейти на платформу TCS23 стала Mediatek.
Источник: 3dnews.ru