AMD построила процессор Ryzen Threadripper HEDT (high-end desktop) в качестве многочипового модуля (MCM), состоящего из двух 8-ядерных «Summit Ridge», причём, каждый из которых имеет собственный двухканальный контроллер памяти и интерфейс PCI-Express. Это не похоже на конкурирующий Core «Skylake-X» от Intel, который является монолитной 18-ядерной матрицей с четырехканальным интерфейсом DDR4 и 44 полосами PCIe на кристалл. AMD разработала несколько новаторских методов преодоления проблем с задержкой, присущих MCM-установке, такой как Ryzen Threadripper, путем использования инновационных технологий nUMA.

На аппаратном уровне четыре 8 ГБ модуля DDR4, заполняющих четыре канала памяти чипа Ryzen Threadripper, рассматриваются как 16 ГБ, контролируемых каждым из двух «Summit Ridge». А для программного обеспечения это безшовный блок объемом 32 ГБ. Здесь, слепое чередование четырёх модулей памяти 8 ГБ, где пропускная способность одного модуля не так проста, как в Core X, чревато проблемами с задержкой. Поток, обрабатываемый ядром матрицы, имеет половинчатое распределение памяти при управлением другой матрицей и поражен латентностью. AMD преодолевает это, рассматривая память на машине Ryzen Threadripper, как на машине с двумя сокетами, в которой каждый сокет имеет свою собственную память.

особенности MCM Ryzen Threadripper

Distributed Mode

Local Mode

сравнение режимов памяти

Программное обеспечение должно быть оптимизировано для просмотра Threadripper с двумя режимами распределения памяти — «Распределенный» (Distributed Mode) и «Локальный» режимы (Local Mode). В распределенном режиме все четыре канала памяти чередуются с приоритетом, обеспечивающим доступ приложения к самой высокой пропускной способности. В локальном режиме приложение сначала загружает память, контролируемую конкретной матрицей, и только затем начинает загружать память, управляемую соседней матрицей. Приоритет здесь — латентность. В своих внутренних тестах распределенный режим даёт более высокую пропускную способность памяти за счёт задержки (но не намного); в то время как локальный режим делает обратное (обеспечивает наименьшую задержку за счёт полосы пропускания).

распределение полос PCI-Express_01

распределение полос PCI-Express_02

распределение полос PCI-Express_03

В AMD исчерпывающе реализовали Ryzen Threadripper, в том числе предложив 64 PCI-Express Gen 3.0. Они не считали полосы общего назначения с чипсета, потому что это Gen 2.0. AMD достигла номера 64, объединив 32 полосы PCIe gen 3.0 каждого из двух кристаллов Summit Ridge, включая 4 полосы, обычно зарезервированные как шина чипсета (соединение между процессором и чипсетом AMD X399). На типичной машине Threadripper 4 из 64 дорожек постоянно выделяются как шина микросхем. Далее, 32 полосы пропускания связаны с PEG (PCI-Express Graphics), управляя двумя видеокартами с полной пропускной способностью x16 или четырьмя картами x8, каждая. Но подождите, у нас ещё остаётся 28 полос! Они могут использоваться для подключения третьего набора слотов PEG (один x16 либо два x8) или до трех слотов M.2 с пропускной способностью x4, оставляя оставшиеся полосы для других бортовых контроллеров.

полоса пропускания Threadripper

Все вместе — это AMD InfinityFabric, высокопроизводительная сборка, соединяющая два 4-ядерных блока CCX в «Summit Ridge», и собственно два «Summit Ridge» создающих Threadripper MCM. Межсоединение сохраняет задержку памяти менее чем 133 нс для ядра, чтобы обращаться к «самой дальней» памяти (модулям DIMM), управляемой соседней матрицей. Энергоэффективность в том, что она потребляет 2 пико-джоуля на бит. Threadripper имеет двунаправленную полосу пропускания 102.22 ГБ/с.

С уважением, проект procompsoft.ru