Kimi K2.6: зачем вышла новая нейросеть, которая умеет писать код по 13 часов подряд

IT и Интернет

17 5,0 8 минут

Автор: Илья Опубликовано: 21.04.2026

В ночь на 21 апреля компания «Юэчжи Аньмянь» (Moonshot AI) выкатила Kimi K2.6 — свою новую флагманскую модель. Первое, что бросается в глаза: её не просто показали, а сразу выложили в открытый доступ вместе с весами. На практике это означает, что модель можно не только пощупать через официальный чат или API, но и при желании развернуть у себя на сервере.

Если кратко — это нейросеть, заточенная под три конкретные задачи: долгое и вдумчивое программирование, работу с визуалом и автономное выполнение сложных цепочек действий через систему агентов. Ниже разбираемся без восторгов и пустых эпитетов — что она реально умеет, где её сильные стороны, а где начинаются компромиссы.

Железо: что под капотом у K2.6

Начинка у K2.6 не революционная, а эволюционная — и это скорее плюс. Архитектурно она повторяет предшественницу K2.5: та же смесь экспертов (MoE) на триллион параметров в сумме, из которых 32 миллиарда активны на каждый токен. Всего задействовано 384 эксперта, а контекстное окно расширено до внушительных 256 тысяч токенов.

Что здесь важно на практике. MoE-архитектура — это когда модель для каждого запроса активирует лишь небольшую часть своих «мозгов», а не гоняет все триллионы параметров разом. Это даёт хорошую производительность при сравнительно умеренном потреблении ресурсов. Плюс на борту остался vision-энкодер MoonViT, благодаря которому модель понимает не только текст, но и картинки с видео.

Для тех, кто захочет развернуть модель локально: будьте готовы к тому, что веса в BF16 весят около 595 ГБ, и для комфортной работы понадобится машина с солидным объёмом памяти. Это не та модель, которую можно запустить на домашнем ноутбуке с 16 ГБ оперативки.

Кодинг: 13 часов без перерыва — это не маркетинг

Главный козырь K2.6 — способность работать над кодом часами, не теряя нить происходящего. Разработчики утверждают, что модель способна непрерывно кодить до 13 часов, внося изменения в более чем 4000 строк за одну сессию. Звучит как красивая цифра для пресс-релиза, но у Moonshot есть конкретные кейсы, которые стоит рассмотреть.

Первый пример — модель взялась за древний (8 лет в опенсорсе — это почти вечность) финансовый движок exchange-core. За 13 часов она проанализировала узкие места через CPU и аллокационные flame-графики, перебрала 12 стратегий оптимизации, внесла правки в 4000+ строк и переконфигурировала топологию ядерных потоков. Итог: медианная пропускная способность выросла на 185% (с 0,43 до 1,24 MT/s).

Второй кейс — локальный запуск на Mac модели Qwen3.5-0.8B с реализацией инференса на Zig, довольно нишевом системном языке. После 12 часов и 4000+ вызовов инструментов скорость генерации подскочила с 15 до 193 токенов в секунду, что примерно на 20% быстрее LM Studio.

Что здесь ценно: модель не просто генерирует код по промпту, а умеет сама искать узкие места, анализировать профили производительности и итеративно улучшать результат. Для разработчиков, которые занимаются оптимизацией легаси-кода или сложными рефакторингами, это может сэкономить дни, а то и недели рутинной работы.

Агенты: 300 цифровых помощников в одной связке

Второе крупное обновление в K2.6 — система Agent Swarm («рой агентов»). Если K2.5 умела управлять сотней параллельных агентов и полутора тысячами шагов, то здесь планка поднята до 300 агентов и 4000 шагов одновременно.

Как это работает на практике. Вы даёте модели сложное задание, она сама разбивает его на подзадачи, создаёт под каждую специализированного агента и координирует их параллельную работу. Например, можно поручить проанализировать сотню компаний из определённого сектора, построить по ним финансовые модели и собрать всё в презентацию в стиле McKinsey — и K2.6 сделает это в рамках одной сессии.

Отдельно стоит отметить адаптацию под фреймворки OpenClaw и Hermes Agent. Внутренний DevOps-агент Moonshot на базе K2.6 проработал автономно пять суток, занимаясь мониторингом инфраструктуры и реагированием на инциденты. Для команд, которые уже используют подобные инструменты, это прямой сигнал, что модель готова к серьёзной эксплуатации, а не только к демо.

Неочевидный нюанс: агентская система эффективна только тогда, когда задача действительно хорошо раскладывается на независимые подзадачи. Если у вас линейный процесс, где каждый следующий шаг жёстко зависит от предыдущего, 300 агентов вам ничего не дадут — модель просто будет работать в однопоточном режиме, как и раньше.

Визуал и дизайн: когда код рисует красиво

У K2.6 заметно прокачали связку «код плюс картинка». Модель умеет не просто верстать страницы, а создавать визуально цельные веб-приложения с продуманной композицией и интерактивными элементами. По внутреннему бенчмарку Kimi Design Bench она уверенно обходит Gemini 3.1 Pro в задачах на создание лендингов и full-stack приложений.

Что это даёт на практике. Можно показать модели референс существующего сайта или просто описать желаемый стиль — и получить готовый прототип с работающей фронтовой логикой и даже базовой бэкенд-частью вроде форм для сбора данных. Для быстрой проверки гипотез или создания MVP это заметно сокращает путь от идеи до рабочего прототипа.

Спорный момент: результаты красивые, но не уникальные. Модель хорошо повторяет существующие паттерны вёрстки и дизайна, однако ждать от неё чего-то принципиально нового в визуальном плане пока рано. Скорее это мощный инструмент для прототипирования, чем замена дизайнеру.

Бенчмарки: где K2.6 обходит флагманов, а где отстаёт

Чтобы не пересказывать все цифры из официальных таблиц, выделю ключевое.

В тестах, где важна способность долго и автономно работать с кодом, K2.6 действительно в лидерах. На SWE-Bench Pro (оценка реальных инженерных задач) она набирает 58,6 — выше, чем GPT-5.4 xhigh (57,7), Claude Opus 4.6 max effort (53,4) и Gemini 3.1 Pro (54,2). На HLE Full с инструментами — 54,0 против 52,1 у GPT-5.4 и 53,0 у Claude. На DeepSearchQA (агентский поиск) отрыв ещё заметнее: 92,5 по F1 против 78,6 у GPT-5.4.

Но есть и слабые места. В задачах на чистое рассуждение без вызова инструментов модель уступает: на AIME 2026 — 96,4 против 99,2 у GPT-5.4, на GPQA-Diamond — 90,5 против 94,3 у Gemini 3.1 Pro. В многозадачных сценариях с инструментами (Toolathlon) K2.6 тоже не первая — уступает GPT-5.4.

Вывод из этого простой: если вам нужна модель, которая будет автономно копаться в коде, искать решения и доводить задачу до результата, — K2.6 выглядит очень убедительно. Если же задача сводится к одному сложному логическому умозаключению без возможности что-то погуглить или запустить, — топовые закрытые модели пока впереди.

Цена и доступ: что почём и где брать

Модель уже доступна на kimi.com, в официальном приложении, через API и в Kimi Code — отдельном инструменте для разработчиков. Веса выложены на Hugging Face под модифицированной лицензией MIT.

По ценам есть важный нюанс: стоимость выросла по сравнению с K2.5. За входящие токены просят 6,5 юаней за миллион (было 4), при кэшировании — 1,1 юаня (было 0,7). В долларах это примерно $0,95 за миллион входящих токенов и $4 за миллион исходящих.

Рост цены ощутимый — около 60%. Но если модель реально экономит часы работы разработчика, это может быть оправдано. Для личного использования или экспериментов бесплатного доступа через официальный сайт, скорее всего, хватит за глаза — ограничения по количеству запросов там обычно не жёсткие.

Для тех, кто хочет развернуть модель локально: имейте в виду требования к железу. Один экземпляр в квантизованном виде требует порядка 150 ГБ памяти, поэтому рассчитывать стоит на сервер с M3/M4 Ultra или связку из нескольких машин. Это не «поставил на домашний ПК и забыл», а скорее решение для команд и компаний с собственной инфраструктурой.

Кому это всё нужно на самом деле

После всего сказанного — короткий ориентир по сценариям.

Когда K2.6 имеет смысл: вы разработчик, который тратит часы на рефакторинг старого кода; вам нужно быстро прототипировать веб-приложение с визуальной частью; вы работаете с большими объёмами информации и хотите делегировать рутинный анализ агенту; вы ищете открытую модель, которую можно дообучить под свои задачи.

Когда K2.6 скорее мимо: вам нужен быстрый ответ на простой вопрос — для этого хватит и бесплатных версий других моделей; вы решаете олимпиадные задачи на логику, где критична точность одного ответа без возможности перепроверить; у вас нет ресурсов на развёртывание модели локально, а платить за API по новым тарифам вы не готовы.

Главное, что стоит понимать: K2.6 — это не универсальный «убийца» всего подряд, а заточенный под конкретные задачи инструмент. В своём узком профиле она действительно показывает результаты на уровне топовых закрытых моделей, а кое-где и превосходит их. Но за пределами этого профиля она остаётся крепким середняком без особых преимуществ.

Если ваша работа связана с кодом, агентами и визуалом — однозначно стоит попробовать хотя бы бесплатную версию. Остальным — смотреть по задачам.

Частые вопросы

Kimi K2.6 — это бесплатно?

Модель доступна бесплатно через сайт kimi.com и официальное приложение. Платный доступ — через API для разработчиков и компаний. Веса модели выложены в открытый доступ, их можно скачать и развернуть самостоятельно.

Чем K2.6 отличается от K2.5?

Главные отличия: способность работать над кодом до 13 часов без потери контекста (против заметно более коротких сессий у K2.5), расширенная агентская система с 300 параллельными агентами вместо 100, улучшенная работа с визуалом и генерацией веб-интерфейсов. Архитектура осталась прежней — изменения в основном в обучении и настройке.

Можно ли запустить Kimi K2.6 на своём компьютере?

Можно, но требования высокие. Полные веса в BF16 занимают около 595 ГБ. Даже в квантизованном виде модели нужно примерно 150 ГБ оперативной памяти. Для локального запуска потребуется сервер с несколькими GPU или мощная рабочая станция с большим объёмом памяти.

Kimi K2.6 понимает русский язык?

Да, модель обучалась на мультиязычных данных и понимает русский язык. Основной упор в обучении делался на английский и китайский, но для большинства практических задач на русском языке качество ответов вполне рабочее.

Как вам статья?

5,0

★ ★ ★ ★ ★

8 голосов