Nvidia представила GPU Ampere. Характеристики и производительность.

На днях компания Nvidia анонсировала долгожданный графический ускоритель семейства Ampere – профессиональный чип Tesla A100. На что способен продукт данной серии, и какие у него характеристики, вы узнаете в этой статье.

Nvidia Ampere A100 технические характеристики.

GPU Nvidia Ampere A100 выпускается компанией TSMC по 7-нанометровому техпроцессу. На кристалле площадью 826 мм2 размещено более 54 млрд транзисторов, что достаточно много. Рядом на текстолите распаяны модули памяти типа HBM2 общим объёмом 40 Гб, которые производит Samsung. Поражает её пропускная способность – 1,6 Тбайт/с. Что характерно для графических ускорителей от Nvidia это специальные фирменные CUDA-ядра, которые используются для вычислений с плавающей запятой: двойной точности (FP64) отведено 3456 штук, одинарной (FP32) — 6912 штук. Количество тензорных ядер достигло 432 штук, предусмотрены и потоковые мультипроцессоры в количестве 108 штук. GA100 содержит 8192 ядра CUDA, и это на 52% больше, чем у GPU GV100.

Производительность.

По заявлению компании обучение нейронных сетей происходит быстрее в 20 раз благодаря новым графическим чипам, по сравнению с предшественниками. Помимо систем с искусственным интеллектом, видеокарты Ampere также используются для анализирования больших объёмов данных, для научных расчётов и облачной графики. Архитектура новых чипов использует технологию тензорных ядер третьего поколения с поддержкой вычислений TF32.

A100 способен достигать своей пиковой производительности в 312 терафлопс в вычислениях с плавающей запятой одинарной точности (FP32), что в 20 раз выше предыдущего чипа семейства Volta. Целочисленные операции (INT8) в системах, способных делать логические выводы, Ampere выполняет со скоростью 1,248 трлн штук в секунду. Отрыв от Volta тоже двадцатикратный. Наконец, в высокопроизводительных операциях с двойной точностью (FP64) новинка NVIDIA оказывается в два с половиной раза быстрее предшественницы.

Поддержка интерфейса NVLink третьего поколения ориентирует A100 на серверное применение, и позволяет обмениваться данными с подобными графическими ускорителями со скоростью 600 Гбайт/с. Каждый чип Ampere поддерживает 12 каналов NVLink 3.0. Впервые за свою долгую историю компания Nvidia в своём серверном сегменте предлагает продукт, который поддерживает PCI Express 4.0. Отлично реализована технология виртуализации MIG, позволяющая разделять ресурсы с одного видеопроцессора на семь других независимых.

Распространение продукции.

Серийное производство A100 уже идёт полным ходом, как заверяет компания Nvidia, графические ускорители уже поставляются клиентам. Чтобы интегрировать новые Ampere в свои вычислительные системы, понадобится какое-то время. Во втором полугодии планируется уже установить вичеочипы в суперкомпьютеры.

Вычислительные системы NVIDIA DGX A100 стоимостью 200 000 долларов, будут включать в себя 8 GPU Nvidia Ampere, связанных между собой интерфейсом NVIDIA NVLink. Объем видеопамяти составит 320 ГБ. Nvidia для своих новых станций выбрала процессоры AMD, а не Intel, как ранее. Если точнее, DGX A100 содержит два 64-ядерных CPU Epyc 7742, а также 1 ТБ ОЗУ. Производительность станции достигает 5 PTFLOPS в задачах ИИ и 10 POPS в формате INT8.

Никакой официальной информации о дате выхода игровых видеокарт на архитектуре Ampere пока нет.

Источник: hightech-review.ru