Новый драйвер NVIDIA значительно повысил производительность видеокарт GeForce RTX и платформ для ПК с технологией RTX AI. Это стало возможным благодаря оптимизации алгоритмов искусственного интеллекта, которые теперь доступны в экосистеме RTX.
По данным NVIDIA, недавние оптимизации были направлены на ускорение работы ряда крупных языковых моделей (LLM), используемых генеративным ИИ.
Новый драйвер обеспечивает трехкратное увеличение производительности при работе с платформами ONNX Runtime (ORT) и DirectML, которые используются для запуска моделей искусственного интеллекта в среде Windows.Кроме того, драйвер улучшил производительность интерфейса программирования WebNN для DirectML, который используется веб-разработчиками для размещения новых моделей искусственного интеллекта. Компания работает с Microsoft над дальнейшим повышением производительности графических процессоров RTX и добавлением поддержки DirectML в PyTorch.
Тесты производительности показали значительный прирост производительности во всех областях, включая обработку данных INT4 и FP16. Производительность некоторых моделей, таких как Phi-3, Llama 3, Gemma и Mistral, увеличилась втрое.
Этот новый продукт является еще одним примером преимуществ экосистемы RTX, которая позволяет использовать возможности воспроизводимых тензорных ядер для ускорения ИИ. NVIDIA продолжает развивать свои технологии, чтобы оставаться лидером в области искусственного интеллекта.
]]>
Свежие комментарии