NVIDIA нацелена на Multi-Chip Module в предстоящих GPU

Multi Chip Module (MCM) ускорителей не является чем-то новым. Хотя, существует и боле ранние реализации, когда дело доходит до узнаваемого оборудования, о котором многие уже слышали, то первые решения восходят к 4-ядерным процессорам Intel Kentsfield и Yorkfield (построенным на 65-нм процессе для решения LGA 775). Однако, особой проблемой такого подхода заключается в наличии мощного, достаточно эффективного взаимодействия, позволяющего различным ядрам в каждом модуле действительно «разговаривать» друг с другом и прекрасно работать в тандеме. Совсем недавно AMD продемонстрировала преимущества настоящего подхода MCM (Multi-Chip-Module) с процессорами Ryzen. Это связано с разработкой модульной архитектуры процессора с мощным межсоединением (Infinity Fabric), что позволило AMD свести размер до минимума (как минимум, это относится к истинному 8-ядерному дизайну), позволяя компании выгодно масштабировать до 16 ядер (2 MCM) с Threadripper и 4 MCM с Epyc (32 ядра).

AMD уже дала намеки на то, что её всё ещё долго-ближайшая архитектура Navi (имеется в виду, и ожидание Vega) принесёт настоящий MCM-дизайн графическим процессорам. Vega уже поддерживает межсетевой интерфейс Infinity Fabric от AMD, прокладывая путь для будущих проектов APU от компании, а также MCM GPU, используя ту же технологию. И, по-видимому, сама NVIDIA делает шаг вперед к будущему MCM, надеясь отказаться от монолитного подхода к дизайну матрицы, который она использует уже давно.

NVIDIA считает, что модульный подход является лучшим, в настоящее время технически и технологически возможным решением для застойного закона Мура. Производительность и сложность CPU и GPU сильно зависят от увеличения количества транзисторов и плотности, развитие которых и, что более важно, развертывание производства замедляется (кривая, которая показалась экспоненциальной, на самом деле является сигмоидальной, eh!). Фактически, в настоящее время оценивается, что самый большой размер кристалла, достижимый с сегодняшней технологией, составляет ~ 800 мм². Дело в том, что Tesla V100 находится на отметке 815 мм², что уже ограничивает технически дозволенные размеры. Этот факт в сочетании с постоянно растущей потребностью индустрии в постоянно растущей производительности приводит к мысли, что GPU GV100 станет одним из последних монолитных графических процессоров NVIDIA. Однако, существует вероятность того, что 7-нм производство даст компании немного больше времени на разработку настоящего решения MCM, хотя, возможно, следующий продукт NVIDIA уже проявится в таком дизайне.

В документе, опубликованном компанией, NVIDIA сообщает, путь вперёд связан с интеграцией нескольких модулей обработки GPU в единый пакет, что позволяет миру GPU достичь того, что уже достиг Ryzen и его братья Threadripper и EPYC: масштабирование производительности с небольшими размерами и, следовательно, более высокими результатами на выходе… В частности, NVIDIA заявляет, что они «(…) предлагают разбиение графических процессоров на легко производимые базовые модули GPU (GPM) и интеграцию их в пакет с использованием технологий с высокой пропускной способностью и эффективностью передачи энергии». В своем техническом документе NVIDIA обозначает, что «оптимизированный дизайн MCM-GPU на 45.5% быстрее, чем самый крупный реализованный монолитный GPU, и выполняется в пределах 10% гипотетического (и невысокого) монолитного графического процессора (…)», и что их «оптимизированный MCM-GPU на 26.8% быстрее, чем в равной степени оборудованная система с несколькими GPU с таким же общим количеством SM и пропускной способности DRAM».

Эти разработки продолжают демонстрировать изобретательность и стремление инженеров к совершенствованию и выглядят чрезвычайно перспективными для компаний, поскольку отказ от монолитной философии дизайна и масштабирования с помощью переменного количества небольших штампов должен обеспечивать большую урожайность и улучшенное масштабирование производительности, таким образом, сохраняя высокий уровень — потребность рынка в удовлетворении потребителей, а технологический выхлоп компаний немного лучше, чем (в основном) уже есть. Исходная ссылка на материал NVIDIA, любознательным весьма интересно будет почитать.

С уважением, procompsoft.ru