Nvidia Rubin CPX: новый ускоритель для ИИ-агентов и длинного контекста снижает стоимость логического вывода

Графические ускорители Nvidia давно стали эталоном для центров обработки данных, когда речь заходит о задачах искусственного интеллекта. Их мощность, быстрая память HBM и развитая экосистема CUDA сделали их незаменимыми для обучения и вывода ИИ. Однако с ростом масштабов моделей и их внедрением в повседневные задачи, особенно у крупных облачных провайдеров, возникла потребность в более гибком подходе к аппаратному обеспечению. Nvidia решила разделить вычисления: теперь для сложной контекстной обработки будет использоваться отдельный ускоритель Rubin CPX, который оптимизирован именно под работу с длинными последовательностями токенов.

Современные языковые модели, такие как GPT-5 или Gemini 2, требуют огромных ресурсов для первичной обработки входных данных — именно на этом этапе и нужен Rubin CPX. Он оснащён 128 ГБ памяти GDDR7, что позволяет эффективно работать с большими объемами информации, не прибегая к дорогой HBM. Такой подход снижает стоимость и энергопотребление, а также упрощает охлаждение системы. В отличие от классических GPU для дата-центров, Rubin CPX не нуждается в сверхширокой полосе пропускания памяти, зато отлично справляется с задачами, где важен объём (фото: Nvidia).

После того как контекст обработан, дальнейшая генерация токенов передаётся на более традиционные ускорители с HBM, такие как Rubin или Blackwell Ultra, где важна скорость доступа к памяти и межсоединения. Вся эта архитектура объединяется в систему Vera Rubin NVL144 CPX, способную выдавать до 8 экзафлопс производительности и работать с сотнями терабайт памяти в одной стойке.

Управление распределением задач между ускорителями автоматизировано с помощью программного слоя Dynamo, который сам определяет, какой этап обработки поручить тому или иному типу GPU. Это позволяет максимально эффективно использовать ресурсы и снижать издержки. Уже несколько компаний заявили о планах внедрить Rubin CPX для генерации кода, создания видео и работы с огромными массивами данных.

Таким образом, Nvidia делает ставку на специализированные решения для разных этапов вывода ИИ, что открывает новые горизонты для сложных и ресурсоёмких задач, а также позволяет оптимизировать расходы на инфраструктуру. Первая система с Rubin CPX ожидается к концу 2026 года. Ярослав Игнатьев

Запись перемещена в архив

XRP подорожал после одобрения Ripple в Люксембурге: компания получила предварительную EMI-лицензию в ЕС

Vox Media и The Atlantic подали частные иски к Google после победы Минюста США в антимонопольном деле

Apple запустила подписку Creator Studio: часть ИИ-функций Final Cut Pro и Pixelmator Pro спрятали за оплатой

Кибертехник выяснил, будет ли работать мессенджер MAX без SIM-карты

Консультант по IT научил подключать Wi-Fi к телефону на Android

IT-специалист научил отключать вход на Госуслуги через мессенджер MAX

Специалист разъяснил, почему не работает WhatsApp на Андроиде

Автомастер научил правильно заряжать аккумулятор в любой машине: так батарея прослужит долго

Nvidia Rubin CPX: новый ускоритель для ИИ-агентов и длинного контекста снижает стоимость логического вывода

Комментариев еще нет