Alibaba представила Qwen3, семейство "гибридных" моделей рассуждений ИИ / фото Midjourney

Китайская компания Alibaba выпустила третье поколение больших языковых моделей Qwen. Судя по тестам, они обходят свежие o1 и o3-mini от OpenAI, а также DeepSeek R1 и Grok 3 от Маска, пишет портал TechCrunch.

Семейство Qwen 3 представляют гибридный подход к решению проблем: это одновременно "думающая" модель и нет. В первом режиме модель пошагово анализирует проблему и выдает комплексный ответ. Режим "недумания" подойдет для быстрых повседневных запросов с мгновенным откликом.

Некоторые модели семейства также используют смешанную архитектуру экспертов (MoE), повышая вычислительную эффективность за счет разбивки задач на части и их передачи более мелким, специализированным "экспертным" моделям.

Видео дня

Большинство моделей Qwen 3 уже доступны для скачивания по "открытой" лицензии на платформах Hugging Face и GitHub.  Кроме того, Qwen 3 можно запускать локально – они варьируются по размеру от 0,6 млрд до 235 млрд параметров.

Использовать ИИ-модели Qwen 3 также можно в веб-версии или в мобильном приложении для iOS и Android. Нейросеть поддерживает 119 языков, включая украинский и русский.

Новая бесплатная ИИ-модель из Китая превзошла ChatGPT и DeepSeek: как воспользоваться

Популярность ChatGPT продолжает достигать новых высот, и в марте этого года он обогнал TikTok и Instagram, став самым скачиваемым приложением в мире. За месяц его установили 46 млн раз.

Пику популярности ChatGPT способствовал вирусный тренд, заключающийся в генерации картинок в стиле мультфильмов Ghibli. В OpenAI говорили, что спрос был настолько высоким, что "плавил" графические процессоры компании.

Вас также могут заинтересовать новости: