Компания ARM представила новую архитектуру ARMv9, что станет основой для разработки мобильных платформ на ближайшее десятилетие. Из статьи вы узнаете, как изменится производительность мобильной электроники, а так же какие нововведения стоит ожидать.
Что такое ARMv9
Архитектура ARMv9 – основа для проектирования ядра процессора для интегрированных систем на кристалле именуемых на английском языке System-on-Chip или сокращенно SoC. Архитектура представляет собой общий набор инструкций и прочих команд для разработчиков программного обеспечения.
Архитектура ARMv9 основана на архитектуре ARMv8 с сохранением обратной совместимости.
Основные изменения и нововведения ARMv9
Основное направление развития ARMv9 – улучшение безопасности и углубленная интеграция искусственного интеллекта. Полный список основных нововведений следующий:
- Новый набор инструкций — SVE2.
- Расширение управления областью — RME.
- Расширение транзакционной памяти — TME.
- Расширение буфера записи ветвления — BRBE.
- Встроенное расширение трассировки — ETE.
- Расширение буфера трассировки — TRBE.
Улучшение машинного обучения
В ARM ожидают стремительный рост использования голосового управления с применением алгоритмов искусственного интеллекта.
В компании обещают увеличить пиковую производительность процессорной части на 30 % в ближайших нескольких поколениях ядер. Поскольку небольшие нагрузки будут выполняться за счет мощности центрального процессора с целью универсального применения алгоритмов ИИ. Задачи, требующие высокой вычислительной мощности или низкого потребления энергии, будут выполняться на отдельных нейронных процессорах.
В подтверждение ожиданий ARM можно заметить, как меняется модель использования смартфона. Пользователи всё чаще используют голосовой поиск вместо ручного ввода, используют различных голосовых помощников и ассистентов, а так же записывают голосовые сообщения с функцией перевода в текст.
Увеличение производительности
В ARMv9 добавят расширенный набор инструкций Scalable Vector Extensions второго поколения или сокращенно SVE2. Такие инструкции используются для задач с высокопроизводительными вычислениями, включая машинное обучение. Расширение SVE2 совместимо с предыдущим поколением, а так же заменит расширение NEON, используемое DSP для нетребовательных задач.
Конфиденциальная вычислительная архитектура
Для повышения безопасности ARM добавит в архитектуру ARMv9 средство аппаратной изоляции. Построенное на базе технологии TrustZone средство защиты генерирует случайные области, представляющие собой дополнительную среду выполнения для обычных программ. Случайные области изолированы от обычных областей и контролируются отдельными микропрограммами или микрооперационной системой. Такая схема исключит доступ зловредной программы к определенным приложениям или операционной системе.
Внутри области могут работать как отдельные приложения, так и вся операционная система или отдельные компоненты ОС. Кроме того политика безопасности области настраивается с использованием небольшого количества безопасного ПО.
Текущие средства изоляции используют преимущественно программный метод, что негативно сказывается на скорости работы. Метод аппаратной реализации позволит максимально исключить задержки в работе и потерю производительности.
Новые CPU и GPU на ARMv9
Компания ARM так же анонсировала 7 новых микроархитектур ядер для ARMv9. Новый дизайн ядер станет основой для производства будущих систем на чипе в изначальном или измененном виде. Для процессорной части представлено 3 типа ядер: Cortex-X2, A710 и A510. Для графического ускорителя 4 типа ядер: Mali-G710, G610, G510 и G310.
Cortex-X2
Ядро Cortex-X2 представляет собой дальнейшее развитие ядра Cortex-X1 с акцентом на высокой производительности. В сравнении с предшественником при одинаковых характеристиках производительность выше на 16%, а производительность машинного обучения выше в 2 раза. Так же вдвое увеличен максимальный объем кэша L3 – 16 МБ. Стоит отметить, Cortex-X2 поддерживает только 64-разрядный режим, поэтому 32-битные приложения работать не будут.
Cortex-A710
Ядро Cortex-A710 — приемник Cortex-A78 со сбалансированной производительностью и энергоэффективностью. Новый дизайн на 10% производительнее и на 30% энергоэффективнее, а так же вдвое производительнее в операциях связанных с машинным обучением. Кроме того Cortex-A710 поддерживает разрядность 32-бит и 64-бит.
Cortex-A510
Ядро A510 – дальнейшее развитие Cortex-A55 с уклоном на максимальную энергоэффективность. Общая производительность в сравнении с Cortex-A55 выше на 35%, энергоэффективность выше на 20%, а производительность машинного обучения выше в 3 раза.
В ARM так же сравнили новую микроархитектуру Cortex-A510 с Cortex-A73 представленной в 2016 году. Современное ядро на 90% производительнее и на 35% энергоэффективнее ядра Cortex-A73.
Возможные конфигурации
Все 3 типа ядер рассчитаны на комбинацию в любом сочетании на усмотрение производителя. В ARM предполагают сохранение тенденции с использованием нескольких производительных ядер в паре с энергоэффективными. Исключение – SoC для нетбуков и ноутбуков с набором производительных ядер.
Mali-G710
Графический ускоритель Mali-G710 – наследник Mali-G78, ориентированный на флагманские системы на кристалле. В ARM отмечают 20% прирост производительности в играх и 20% сбережение энергии, а так же 35% увеличение машинного обучения. При этом максимальная вместимость шейдерных ядер в Mali-G710 составит 16 штук, тогда как Mali-G78 масштабируется до 24 ядер.
Mali-G610
Характеристики Mali-G610 соответствуют Mali-G710 с разницей в масштабируемости до 6 шейдерных ядер. Аналогичный поход использовался и в предыдущем поколении с Mali-G68 – полной копии флагманского ядра Mali-G78 с ограничением вместимости ядер до 6 штук. Поэтому в ARM так же позиционируют G610 для применения в смартфонах предтопового уровня.
Mali-G510
Ядро Mali-G510 позиционируется в качестве приемника Mali-G57 для смартфонов среднего уровня. В ARM обещают прирост производительности на 100%, повышение энергоэффективности на 22% и 100% прирост в задачах машинного обучения. Количество шейдерных ядер 2-6 и возможностью выбора производителем до 10 конфигураций.
Mali-G310
Ядро начального уровня Mali-G310 демонстрирует 6-кратную прибавку производительности текстурированя, 4.5-кратное увеличение производительности Vulkan и 2-кратное увеличение производительности «широкого спектра контента» относительно предшественника Mali-G31. Ускоритель вмещает одно шейдерное ядро с возможностью выбора производителем до 5 конфигураций.
Вывод
В статье детально описаны особенности архитектуры ARMv9. Основные изменения направлены на улучшение безопасности и работы ИИ. А новая микроархитектура ядер позволит увеличить производительность в общих задачах и связанных с работой искусственного интеллекта. Кроме того в ARM постепенно прекращают поддержку разрядности 32-бит и готовятся к полному переходу на 64-битную разрядность, что потребует переработки разработчиками некоторых игр и приложений.
А какие ваши ожидания относительно ARMv9? Поделитесь мнением в комментариях внизу статьи.