Процессоры на одном кристалле достигли своих пределов

252
Суперчип процессора Grace от NvidiaNVIDIA
Суперчип процессора Grace от NvidiaNVIDIA

Процессоры на одном кристалле кажется все!

Процессоры на одном кристалле. Компания Apple в очередной раз удивила энтузиастов и аналитиков, анонсировав M1 Ultra, вариант M1 Max, который фактически объединяет два чипа в один. В результате двухчиповая конструкция рассматривается программным обеспечением как единый кусок кремния. Nvidia представила аналогичные новости на конференции GPU Technology Conference 2022, где генеральный директор Дженсен Хуанг объявил, что компания объединит два новых процессора Grace CPU в один «суперчип».

Эти анонсы нацелены на разные рынки. Apple нацелена на потребительские и профессиональные рабочие станции, а Nvidia намерена конкурировать в области высокопроизводительных вычислений. Однако расхождение в целях лишь подчеркивает серьезные проблемы, быстро приближающие конец эры монолитных чипов.

Многочиповый дизайн не нов, но за последние пять лет эта идея приобрела большую популярность. AMD, Apple, Intel и Nvidia в той или иной степени занимаются этим. AMD продолжила разработку чиплетного дизайна в своих процессорах EPYC и RYZEN. Intel планирует последовать этому примеру с Sapphire Rapids, предстоящей архитектурой для серверного рынка, построенной на использовании чиплетов, которые она называет «плитками». Теперь к этой компании присоединились Apple и Nvidia — хотя их проекты нацелены на совершенно разные рынки.

Процессоры на одном кристалле чиплет
Суперчип процессора Grace от NvidiaNVIDIA

Сдвиг в сторону многокристального проектирования обусловлен проблемами современного производства микросхем. Миниатюризация транзисторов замедлилась, однако рост числа транзисторов в передовых разработках не подает признаков замедления.

В M1 Ultra от Apple 114 миллиардов транзисторов, а площадь матрицы (или площадь изготовления) составляет примерно 860 квадратных миллиметров (официальная цифра для M1 Ultra недоступна, но площадь матрицы одного чипа M1 Max составляет 432 мм2). Количество транзисторов в процессоре Grace от Nvidia пока не разглашается, но GPU Hopper H100, анонсированный вместе с процессором Grace, включает 80 миллиардов транзисторов. Для сравнения, 64-ядерный процессор EYPC Rome от AMD, выпущенный в 2019 году, имеет 39,5 млрд транзисторов.

Такое большое количество транзисторов доводит современное производство чипов до предела, делая многочиповую конструкцию более привлекательной. «Упаковка многочиповых модулей позволила игрокам на рынке микросхем обеспечить лучшую энергоэффективность и производительность [по сравнению] с монолитными конструкциями, поскольку размер матрицы для чипов становится все больше, а проблемы выхода пластин становятся все более заметными», — сказал в электронном письме Акшара Басси, аналитик компании Counterpoint Research. Если не считать Cerebras, стартапа, пытающегося создать чипы, занимающие всю площадь кремниевой пластины, индустрия чипов, похоже, согласна с тем, что монолитный дизайн приносит больше проблем, чем пользы.

Этот переход к чиплетам произошел при поддержке производителей. Taiwan Semiconductor Manufacturing Co. является лидером, предлагая набор усовершенствованных технологий упаковки под названием 3DFabric. Технологии, входящие в состав 3DFabric, используются AMD в некоторых моделях процессоров EPYC и RYZEN и почти наверняка используются Apple для M1 Ultra (Apple не подтвердила это, но M1 Ultra производится TSMC). У Intel есть свои собственные технологии упаковки, такие как EMIB и Foveros. Хотя изначально технология производства чипов Intel предназначалась для собственного использования, она становится актуальной для более широкой отрасли, поскольку открываются двери Intel Foundry Services.

«Экосистема, связанная с основами проектирования, производства и упаковки полупроводников, развилась до уровня, позволяющего узлам проектирования экономично и надежно производить решения на базе чиплетов», — сказал Марк Носсокофф, старший аналитик Hyperion Research, в электронном письме. «Программные средства проектирования для бесшовной интеграции функциональности различных чиплетов также созрели для оптимизации целевой производительности решения».

Чиплеты останутся, но на данный момент это мир разрозненности. AMD, Apple, Intel и Nvidia используют свои собственные конструкции соединений, предназначенные для конкретных технологий упаковки.

Universal Chiplet Interconnection Express надеется объединить отрасль. Этот открытый стандарт, объявленный 2 марта 2022 года, предлагает «стандартный» 2D-пакет, ориентированный на «экономически эффективную производительность», и «расширенный» пакет, ориентированный на передовые разработки. UCIe также поддерживает внепакетное подключение через PCIe и CXL, открывая потенциал для подключения нескольких чипов к нескольким машинам в высокопроизводительной вычислительной среде.

УНИВЕРСАЛЬНЫЙ ЧИПЛЕТНЫЙ ИНТЕРКОННЕКТНЫЙ ЭКСПРЕСС
УНИВЕРСАЛЬНЫЙ ЧИПЛЕТНЫЙ ИНТЕРКОННЕКТНЫЙ ЭКСПРЕСС

UCIe — это начало, но будущее стандарта еще не определено. «Основатели UCIe представляют собой впечатляющий список участников из широкого спектра областей проектирования и производства технологий, включая экосистему HPC», — сказал Носсокофф, — «но ряд крупных организаций еще не присоединились, включая Apple, AWS, Broadcom, IBM, NVIDIA, другие компании по производству кремния и производители памяти».

Басси отмечает, что Nvidia, возможно, особенно неохотно примет участие в проекте. Компания открыла свой собственный интерконнект NVLink-C2C для интеграции в пользовательский кремний, что делает его потенциальным конкурентом UCIe.

Но хотя судьба таких межсоединений, как UCIe и NVLink-C2C, определит правила игры, они вряд ли изменят ход игры. M1 Ultra от Apple можно считать катализатором в угольной шахте. Многочиповый дизайн больше не предназначен для центров обработки данных — он придет в ваш домашний компьютер.

# Процессоры на одном кристалле