Nvidia начала рассылку образцов своих новейших графических процессоров Vera Rubin для систем искусственного интеллекта. Этот шаг подчёркивает движение компании к запуску следующего поколения своей вычислительной платформы для ИИ, ориентированной на ускорение задач обучения и инференса больших языковых моделей (LLM).
Архитектура и производительность
Система Vera Rubin включает в себя 88-ядерный центральный процессор Vera, который работает в тандеме с графическими процессорами Rubin. Каждый GPU оснащён 288 ГБ памяти HBM4. Такая конфигурация значительно увеличивает пропускную способность памяти и вычислительную мощность, что критически важно для работы с обширными наборами данных и сложными нейронными сетями в приложениях ИИ.
Nvidia заявляет, что архитектура Rubin является значительным шагом вперёд в производительности ИИ, предлагая улучшенную эффективность и масштабируемость по сравнению с предыдущими поколениями. Ожидается, что полная линейка продуктов Vera Rubin будет представлена во второй половине 2026 года, как раз после первоначальных поставок образцов. В начале года на CES 2026 глава Nvidia, Дженсен Хуанг, анонсировал запуск производства NVL72 на базе Vera Rubin. Он также отметил, что компания переходит на ежегодный цикл выпуска новых чипов.
Эта платформа, согласно оценкам Nvidia, в десять раз превосходит предыдущую по эффективности на ватт, потребляя при этом примерно вдвое больше энергии, чем Blackwell. Интеграция 3-нм техпроцесса TSMC и первой в мире реализации HBM4 позволила разместить 336 миллиардов транзисторов на одном GPU Rubin, в то время как сопроцессор Vera CU содержит 227 миллиардов транзисторов. Это обеспечивает 3.5-кратный прирост производительности при обучении и 5-кратное увеличение пропускной способности при инференсе по сравнению с серией Blackwell. Флагманский «Vera Rubin Superchip» объединяет один CPU и два GPU в единый когерентный пакет через NVLink-C2C второго поколения.
Система NVL72, состоящая из 72 GPU и 36 CPU, а также использующая матрицу NVSwitch, по заявлениям топ-менеджеров Nvidia, обеспечивает 10-кратное снижение стоимости инференса на токен для моделей ИИ с архитектурой "mixture of experts" (MoE) и 4-кратное сокращение количества GPU, необходимых для их обучения, по сравнению с предыдущим поколением систем Grace-Blackwell NVL72.
Применение и перспективы
Платформа Vera Rubin разработана для широкого спектра сценариев использования ИИ, включая обработку естественного языка, компьютерное зрение и научные вычисления. Она также совместима с существующими фреймворками и инструментами ИИ, что гарантирует плавный переход для разработчиков и исследователей.
Поставка первых образцов знаменует собой важный этап в развитии аппаратного обеспечения ИИ и свидетельствует о сохраняющемся лидерстве Nvidia на быстрорастущем рынке. Ожидается, что GPU Vera Rubin будут способствовать инновациям в таких отраслях, как здравоохранение, финансы, автономный транспорт и умные города.
Отдельные заказчики уже получили образцы Vera Rubin для тестирования и валидации перед официальным релизом. Конкретные данные о производительности и ценообразовании пока не раскрыты, однако аналитики ожидают, что новые GPU установят новые стандарты в области ИИ-вычислений.