
Китайская компания Alibaba анонсировала предварительную версию своей новой модели Qwen3-Max-Thinking, которая предназначена для решения сложных задач, требующих логического мышления и многошаговых рассуждений. Эта модель является экспериментальной модификацией флагманской линейки Qwen3-Max.
По данным компании, Qwen3-Max-Thinking оснащена 1 триллионом параметров и построена на архитектуре Mixture-of-Experts (MoE). Это позволяет активировать лишь часть параметров при каждом запросе, обеспечивая высокое качество вывода при умеренном потреблении ресурсов.
В ходе тестирования модель продемонстрировала идеальные результаты на сложных бенчмарках AIME 2025 и HMMT, которые используются для оценки способности моделей решать задачи с элементами рассуждения и аналитического анализа.
Хотя Qwen3-Max-Thinking все еще находится на этапе активного обучения, она уже продемонстрировала потенциал, сопоставимый с известными системами уровня GPT-5 и Gemini 2.5. Пользователи могут получить ранний доступ к модели через Qwen Chat и API Alibaba Cloud.
Компания также уточнила, что особое внимание уделено устойчивости модели к ложным выводам и способности к самооценке решений, что приближает Qwen3-Max-Thinking к метакогнитивным ИИ.
Ожидается, что официальный релиз полной версии модели состоится в начале 2026 года. Alibaba продолжает активную работу над развитием линейки Qwen, внедряя все новые технологии и подходы к программированию, что делает ее серьезным конкурентом в сфере ИИ.
]]>
Свежие комментарии