Архитектура Volta повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения nVidia Pascal.
Графическая карта NVIDIA Quadro GV100
Обеспечивает ускорение обработки графики до 30% и увеличение скорости рендеринга до 62%.
NVIDIA Volta – это новая движущая сила искусственного интеллекта. Основанная на пяти прогрессивных технологиях, архитектура Volta поспособствует прорыву во всех отраслях. Такие серьезные достижения для человека, как искоренение рака и революция в сфере перевозок за счет появления беспилотных транспортных средств, уже в пределах досягаемости.
Volta использует второе поколение высокоскоростной технологии внутренего соединения NVIDIA NVLink. NVLink2 ускоряет обмен данных в 2 раза по сравнению с интерфейсом NVLink первого поколения. Это обеспечивает расширенные возможности распараллеливания данных для достижения максимальной производительности приложений.
Большой объем памяти GPU с высокой пропускной способностью позволяет визуализировать огромные модели и сложные сцены, а также производить вычисления с использованием больших наборов данных.
Обеспечивают самую высокую скорость параллельной обработки данных и одновременную передачу данных между GPU и хостом, ускоряя известные техники, такие как трассировку лучей, цветокоррекцию и моделирование физических явлений.
Технология Bindless Textures. Значительно увеличивает число уникальных текстур, доступных для шейдерной программы во время работы, обеспечивая более выразительные и детализированные структуры и различные материалы в сценах.
Специальный движок для кодирования H.265/HEVC, независимый от 3D и вычислительного конвейера, обеспечивает более высокую производительность, чем в режиме реального времени, для транскодировки, редактирования видео и других приложений для кодирования.
Алгоритм сглаживания до 64x FSAA (128X со SLI) заметно снижает эффект зубчатости и неровность изображения, обеспечивая высокую реалистичность сцен.
30-битная глубина цвета (10 бит на цвет) обеспечивает миллиарды, а не миллионы цветовых вариаций для насыщенного яркого изображения с широчайшим динамическим диапазоном.
Поддержка технологии NVIDIA RTX, которая обеспечивает трассировку лучей в реальном времени для разработчиков и дизайнеров. Оптимизация трассировки лучей RTX под архитектуру Volta помогла добиться ускорения сложного рендеринга до 10 раз. Для быстрой работы системы шумоподавления OptiX AI, встроенной в NVIDIA RTX, обеспечивается скорость вычислений в 118,5 Терафлопс.
Разработчики могут воспользоваться возможностями трассировки лучей RTX через интерфейс NVIDIA OptiX, новый API для трассировки лучей Microsoft DirectX Raytracing, а в будущем и ещё один новый API Vulkan. Реалистичное освещение, отражения, преломления и тени, рассчитываемые при помощи трассировки лучей, использующей шумопонижение с использованием искусственного интеллекта из OptiX, обеспечивает отличную производительность при фотореалистиной картинке.
Компания Adobe находится в списке 20 компаний производителей приложений профессиональной графики поддержавших технологию NVIDIA RTX.
Характеристики NVIDIA Quadro GV100
- Построена на чипсете: GV100, 12нм техпроцесс FFN (FinFET NVIDIA), 21.1 миллиарда транзисторов, площадь 815 мм2.
- 80 блоков SM. 5120 (FP32) CUDA ядер, 2560 (FP64) CUDA ядер и 640 тензорных ядер (Tensor Cores).
- Ядро и шейдерные блоки работают на частоте: 1200 и 1447 МГц (Boost).
- Число блоков растеризации (ROP): 128.
- Число текстурных блоков (TMU): 320.
- Кэш память второго уровня (L2): 6Мбайт, взаимодействующего с чипом с производительностью до 80 Тб/с. Каждый контроллер памяти подключен к 768 КБ кэша L2, который составляет 6 МБ кэша второго уровня для всего чипа.
- Производительность с половинной точностью (FP16) - 29.6 Тфлопс, с одинарной точность (FP32) - 14.8 Тфлопс, с двойной точностью (FP64) - 7.4 Тфлопс. Peak Integer Operation (INT8) Performance - 59.3 Тфлопс.
- Производительность тензорных ядер (глубокое обучение, Deep Learning TOP) – 118.5 Тфлопс.
- Base Clock: 12.288TFLOPs + 98.304TFLOPs = 110.592TFLOPs.
- Boost Clock: 14.817TFLOPs + 118.538TFLOPs = 133.335TFLOPs.
- Скорость заполнения текстур: 463 Гтекс/с.
- Максимальная скорость закраски: 185.2 Гпикс/с.
- 32 Гбайта памяти HBM2 (ECC выключено по-умолчанию) работает на частоте 1700 МГц и имеет пропускную способность 870 Гбайт/с. Память типа HBM2, размещёна в одном корпусе с GPU по технологии CoWoS (Chip-On-Wafer-On-Substrate).
- 4096-битный интерфейс памяти, позволяет передавать данные GPU со скоростью 1,4 Гтрансфера/с.
- Система компрессии памяти, на 25% улучшает ее пропускную способность.
- Поддержка шины NVLink 2-го поколения (2-way) с пропускной способностью: 200 Гб/с (в двух направлениях).
- Пара видеокарт может объединяться при помощи двух интерфейсов NVLink, обеспечивая совокупный объём памяти до 64Гбайт.
- Интерфейс: PCI Express 3.0 x16. Удваивает скорость передачи данных до 5 Гб/с на канал, обеспечивая суммарную пропускную способность в 16 Гбит/с в обоих направлениях (8 Гбит/с в каждом).
- Порты: 4х DisplayPort 1.4, 3-pin mini-DIN разъем через 4-pin header для стерое сигнала, Quadro Sync разъем (совместимый с Quadro II Sync).
- DisplayPort 1.2 Certified, DisplayPort 1.3/1.4 Ready.
- Максимальное разрешение DisplayPort 1.4: 4x 4096х2160 @ 120Hz, 4x 5120х2880 @ 60Hz или 2x 7680х4320 @ 60Hz.
- Поддержка HDR через DisplayPort 1.4 (SMPTE 2084/2086, BT.2020) (4K @ 60 Hz 10/12-битное HEVC декодирование, 4K @ 60 Hz 10-битное HEVC кодирование).
- Поддержка HDCP 2.2 через DisplayPort и HDMI.
- Поддержка технологии NVIDIA 3D Vision.
- Поддержка: 64x anti-aliasing.
- Поддержка: DirectX 12 + Shader Model 5.1.
- Оптимизация и поддержка OpenGL 4.6.
- Поддержка: NVIDIA SLI, Quadro Sync, Quadro Mosaic, Quadro Digital Video Pipeline.
- Поддержка: NVIDIA CUDA 8, DirectCompute 5.0, OpenCL 2.0, Vulkan 1.0.
Поддержка технологии NVIDIA GPUDirect for Video. Возможности NVIDIA GPUDirect повышают производительность вычислений, когда скорость передачи данных или сокращение времени ожидания являются ключевыми, обеспечивая прямой доступ к памяти GPU устройствам сторонних производителей, таким как SDI видеоадаптеры, NIC и SSD. Технология NVIDIA GPUDirect for Video позволяет аппаратному обеспечению сторонних производителей работать напрямую с NVIDIA GPU.
Благодаря использованию нового API решена проблема слишком длительных задержек. С технологией NVIDIA GPUDirect for Video устройства полностью синхронизированы и CPU не тратит свои ресурсы на копирование данных между драйверами устройств.
NVIDIA NVENC 3.0 - три встроенных чипа NVENC, с поддержкой неограниченного количества потоков (упирается в количество бортовой видеопамяти).
Поддержка кодирования следующих форматов: 8-бит H.264 (AVCHD) 4096х4096 YUV 4:2:0/YUV 4:4:4/Lossless, 10-бит H.265 (HEVC) 8192х8192 YUV 4:2:0/YUV 4:4:4/Lossless.
1x чип NVDEC с поддержкой форматов: 8-бит MPEG-2 4080х4080, 8-бит VC-1 2048х1024, 8-бит H.264 (AVCHD) 4096х4096 YUV 4:2:0, 12-бит H.265 (HEVC) 8192х8192 YUV 4:2:0, 8-бит VP8 4096х4096 и 12-бит VP9 8192х8192.
Поддержка операционных систем: Microsoft Windows 10 (64-bit), Microsoft Windows 8.1 и 8 (64-bit), Microsoft Windows 7 (64-bit) и Linux.
WHQL / ISO9241 / EU RoHS / J-STD / JIG / REACH / HF / WEEE / RCM / BSMI / CE / FCC / ICES / KCC / cUL, UL / VCCI.
Уровень TDP: 250 Вт (в режиме ожидания 18Вт).
Поддержка стандарта EnergyStar.
Требования к блоку питания: 600Вт. Дополнительные 8-штырьковый и 6-штырьковые силовые разъёмы питания PCIe.
Двухслотовая активная система охлаждения с вентилятором. Бесшумный дизайн вентилятора обеспечивает уровень шума ниже 28 дб для ультратихой рабочей среды.
Размеры видеокарты: 266.7х111.15х37 мм.
Вес: 980 грамм + 72 грамма (extender).
Производители и модели видеокарт: PNY VCQGV100-PB (для Америки и Европы), ELSA/Ryoyo EQGV100-32GER (для Японии), Leadtek (для Азии). OEM модели и производители: HP NVIDIA Quadro GV100 (3ME26AA), Dell EMC, Lenovo, и Fujitsu.
Источник: www.nvidia.com