Великий китайський маркетплейс Alibaba представив свою нову модель нейромережі Qwen2.5-Max.
Про це повідомили в компанії.
За словами розробників, модель перевершує ChatGPT і DeepSeek за багатьма показниками, або, як кажуть фахівці у сфері штучного інтелекту, бенчмарками: Arena-Hard, LiveBench, LiveCodeBench і GPQA-Diamond. Також новинка демонструє близькі до конкурентів результати в інших бенчмарках, наприклад MMLU-Pro.
Зазначається, що Qwen2.5-Max є великомасштабною моделлю, яку було попередньо навчено на більш ніж 20 трильйонах токенів.
При цьому нейромережа має доступ до інтернету і може працювати з актуальними даними. Також вона вміє писати код, генерувати фото і відео, хоча остання функція поки недоступна.
Передбачається, що модель викладали поспіхом, щоб встигнути потрапити в інформаційну хвилю про ШІ-сенсації, приурочену до китайського нового року. Тому перший час у неї можуть проявлятися недоліки.