🧨 Убийца Qwen? Встречайте MiniCPM5-1B — крошка, которая делает стыдно большие модели

🧨 Убийца Qwen? Встречайте MiniCPM5-1B — крошка, которая делает стыдно большие модели Китайцы снова удивили. Команда OpenBMB выкатила MiniCPM5-1B в полный open-source. Что значит «полный»? Веса, код для деплоя, обучающие данные — всё в открытом доступе. Бесплатно. Без лицензионных игр. 🤯 📊 А теперь по цифрам. Они безумные При весе всего в 1 миллиард параметров эта малышка заняла 1 место на Artificial Analysis среди всех моделей до 2B. Счёт: 17.9 балла. Для сравнения: — Qwen3.5-2B (которая в два раза больше!) — 16.3 балла — Qwen3.5-0.8B и LFM2.5-1.2B-Thinking — остались далеко позади Она меньше, но умнее. Как это работает? Понятия не имею, но звучит как магия. 🪄 🧠 Что умеет? Почти всё В тестах на: — логику — математику — кодинг — работу с инструментами MiniCPM5-1B оставляет конкурентов позади. При том что некоторые из них крупнее в 2-3 раза. 📱 Самое сочное — размер INT4-версия весит всего 0.5 ГБ. Полгигабайта. Это меньше, чем одна фотография с современного смартфона. Что это значит на практике: — Запуск прямо на телефоне (без интернета) — Работа внутри браузера — Использование на слабых edge-устройствах (датчики, камеры, умная периферия) ИИ, который помещается в карман и не просит облако. 🔥 🤖 А теперь вишенка на торте: ForgeTrain Модель обучали на фреймворке ForgeTrain. Чем он уникален? Это первый в индустрии production-grade фреймворк для претрейна LLM, который полностью написан нейросетью. Ни одного человека-программиста. Вообще. И при этом ForgeTrain работает на 10% быстрее хвалёного NVIDIA Megatron. Нейросеть написала код для обучения другой нейросети. Которая теперь делает стыдно Qwen. Это какой-то ИИ-инцест, но результат впечатляет. 😄 🔗 Где забрать Модель уже на ModelScope: 👉 modelscope.cn/models/OpenBMB/MiniCPM5-1B Качайте, тестируйте, запускайте на телефоне. Ну и ставьте 👍, если зашло.

320 просмотров