Нефоннеймановская архитектура, до 192 ГБ памяти и производительность в разы выше, чем у Nvidia HGX B200. Представлен необычный ИИ-ускоритель NextSilicon Maverick-2

Нефоннеймановская архитектура, до 192 ГБ памяти и производительность в разы выше, чем у Nvidia HGX B200. Представлен необычный ИИ-ускоритель NextSilicon Maverick-2

Фото NextSilicon

 

Мы уже привыкли, что, когда речь заходит об ИИ-вычислениях, лучшими решениями являются GPU. Компания NextSilicon утверждает, что её ускоритель Maverick-2, опирающийся на нестандартную архитектуру, кладёт на лопатки не только процессоры, но и GPU. Правда, с оговорками.

Maverick-2, построенный на вычислительной архитектуре NextSilicon (ICATM), использует новую аппаратную архитектуру управления потоками данных, которая устраняет фундаментальные недостатки трёх традиционных подходов: вычислений на основе CPU, GPU и ASIC.

Разработчик утверждает, что производительность его детища до 10 раз выше, чем у ведущих графических процессоров, при снижении энергопотребления до 60% — и всё это с использованием немодифицированного, готового кода.

В отличие от центральных и графических процессоров, наша архитектура потоков данных, не основанная на фон-неймановском принципе, полностью устраняет накладные расходы на обработку инструкций и узкие места в памяти. Доступность данных определяет вычисления, а не наоборот. Мы также изменили соотношение распределения памяти на кристалле, выделив большую часть аппаратного пространства для вычислений, а не для управления. 

Согласно внутренним тестам самой NextSilicon, Maverick-2 обеспечивает до четырёх раз более высокую производительность (FP64) на ватт, чем HGX B200, и более чем в 20 раз более высокую эффективность, чем Intel Xeon Sapphire Rapids. В тестах GUPS новинка показывает результат в 32,6 GUPS при 460 Вт, что в 22 раза быстрее, чем CPU и в шесть раз быстрее, чем GPU. В рабочих нагрузках ускоритель NextSilicon достиг 600 GFLOPS при 750 Вт, потребляя при этом примерно половину мощности конкурирующих решений.

Правда, как мы знаем, современные ИИ-вычисления в основном опираются на формат FP4/FP8, а тут у нас данных нет.

Maverick-2 доступен в двух версиях. Базовая имеет 96 ГБ памяти HBM3E и потребляет до 400 Вт, тогда как Maverick-2 OAM располагает двумя вычислительными кристаллами, 192 ГБ памяти, но и потребляет уже 750 Вт.

Нефоннеймановская архитектура, до 192 ГБ памяти и производительность в разы выше, чем у Nvidia HGX B200. Представлен необычный ИИ-ускоритель NextSilicon Maverick-2

Фото NextSilicon

 

 

 

Источник: industry-hunter.com

Next Post

ИИ даёт искажённые ответы на каждый второй вопрос: опубликованы результаты нового исследования

Изображение Midjourney   ИИ-помощники дают искаженные ответы почти в половине случаев, выявило исследование Европейского вещательного союза (EBU) при поддержке BBC. Профессиональные журналисты из 22 общественных СМИ 18 стран, работающие на 14 языках, оценили более 3 тыс. ответов ChatGPT, Copilot, Gemini и Perplexity на точность, качество источников, умение отделять мнение от […]