Время релизов.
Две недели назад мы представили Octofs, Octobrain, Octolib и preview Octomind cloud. С тех пор каждый из них выпустил минимум один релиз — большинство несколько.
Octofs 0.4.3 — regex-поиск, параллельный обход и команда delete
github.com/muvon/octofs · 0.4.0 → 0.4.3
MCP-сервер файловой системы, который мы представили 3 мая, построен вокруг одного обещания: ловить режимы отказа, которые AI-агенты создают при работе с кодом. Линия патчей 0.4.x продолжает закручивать гайки.
Что нового с 0.4.0:
- Regex-поиск по контенту.
viewтеперь принимает regex-паттерн в дополнение к литеральным строкам. Агентам, которым нужно найти call-сайты, ссылки или структурные совпадения, не приходится откатываться наshell+ ripgrep — это полноценный режим поиска. - Параллельный обход файлов. Обход директорий теперь многопоточный с общим пулом воркеров. Большие монорепы, которые индексировались секундами, теперь отвечают за сотни миллисекунд. Gitignore по-прежнему уважается в каждом каталоге.
- Команда
deleteвtext_editor. Агенты могут атомарно удалять строки, диапазоны или файлы тем же инструментом, которым редактируют — безrmчерез shell. Тот же контракт атомарной записи: файл либо есть, либо нет, без промежуточного состояния. - Сохранение прав файла в
atomic_write. До 0.4.2 запись тихо сбрасывала режим файла на umask по умолчанию. Редактировать исполняемый скрипт и терять бит+xломало вещи. Исправлено: права читаются до записи временного файла и применяются перед rename. - Стабильные ключи lock для несуществующих файлов. Конкурентное создание с алиасингом пути (
./a.rsvsa.rs) было гонкой. Теперь оба разрешаются в один канонический lock до создания файла. - JSON-параметры массива. Некоторые MCP-клиенты сериализуют аргументы-массивы как JSON-строки. Octofs теперь принимает обе формы прозрачно, и агенты больше не падают на расхождении
"[[1,50]]"vs[[1,50]].
Если были на 0.4.0 — можно переходить на 0.4.3 без изменений конфигурации. Режим строк по хешу, fuzzy-матчинг, обнаружение конфликтов в батче — всё на месте, только быстрее и острее.
cargo install octofs --version 0.4.3
# или возьмите бинарь на https://github.com/muvon/octofs/releases
Octobrain 0.6.1 — тихий релиз поверх громкого
github.com/muvon/octobrain · 0.6.0 → 0.6.1
0.6.0 был большим — полное чтение документов через knowledge read, regex match по индексированному контенту, потоковая отдача результатов запросов и наконец-то удалённый инструмент auto_link. 0.6.1 — обслуживающий проход поверх: апгрейды зависимостей и подкрученный release-профиль, уменьшающий размер бинаря и сбивающий миллисекунды с холодного старта.
В 0.6.1 нет изменений API. Если уже выкатили 0.6.0 — это drop-in апгрейд. Если нет, пост 0.6.0 объясняет, что на самом деле делают команды read и match — и почему «память» вашей ИИ должна включать прочитанные документы, а не только разговоры.
Octolib 0.21.5 — reasoning effort, prompt cache keepalive, два новых провайдера
github.com/muvon/octolib · 0.19.0 → 0.21.5
Octolib — движок за каждым LLM-вызовом, который мы делаем — Octomind, Octocode, Octofs, агенты в продакшне, скрипты в наших терминалах. С анонса 27 апреля он прошёл с 0.19.0 до 0.21.5. Шесть минорных версий, двенадцать патчей. Что изменилось:
- Reasoning effort между провайдерами. Унифицированный параметр
effort, который маппится на adaptive thinking Anthropic, на reasoning-тиры OpenAI и эквивалентные ручки у каждого провайдера, который их поддерживает. Один вызов — все бэкенды. Slash-команда/effortв Octomind подключена прямо к этому. - Adaptive thinking от Anthropic. Передайте
effort = "high"— и Claude выделит больше бюджета на размышления;"low"— оставит быстрым. Цена создания кеша на TTL теперь тоже учитывается корректно. - Политика keepalive prompt-кеша. Длинноживущие агенты теряли закешированные промпты, потому что TTL в 5 минут истекал между вызовами инструментов. Octolib теперь поддерживает кеш горячим фоновым heartbeat. Результат: на порядки дешевле разговоры, когда контекст уже собран.
- Два новых провайдера.
- Fireworks AI — быстрый OSS-инференс для Llama, Qwen, Mixtral.
- Featherless — модели на хостинге сообщества с оплатой по токену.
- Tool calling DeepSeek. Формат tool-call DeepSeek был нестандартным; Octolib теперь правильно его парсит и поддерживает полный цикл thinking + tool-use.
- Картинки и видео через URL. Раньше нужно было base64-кодировать медиа; теперь passthrough по URL с учётом провайдера — по умолчанию там, где поддерживается.
- Reranker HuggingFace через XLM-RoBERTa. Многоязычный cross-encoder reranking поверх существующего dense + sparse ретрива. Сигмоидная нормализация скоров.
- HTTP/2 keep-alive + сжатие на каждом исходящем вызове. Переиспользование соединения для высокопоточных агент-нагрузок. Ретрай на устаревших соединениях. Меньше tail latency под устойчивой нагрузкой.
Если строите что-то, вызывающее LLM из Rust — это слой, на котором стоит стандартизироваться. Anthropic, OpenAI, Google Gemini, DeepSeek, Moonshot, MiniMax, Z.ai, OpenRouter, NVIDIA NIM, Cerebras, Together, Cloudflare Workers AI, Fireworks, Featherless, Ollama, кастомные эндпоинты — один и тот же трейт, та же логика ретрая, тот же учёт стоимости.
Octomind 0.29.0 — пять релизов за три недели
github.com/muvon/octomind · 0.25.0 → 0.29.0
Runtime агентов сегодня достиг 0.29.0. Пять релизов за три недели — этот темп не планировался, это cloud-preview вскрывал, что нужно править в реальном времени. Мы правили. Полная история на octomind.run; короткий список:
- Персистентность расписания и команда
/schedule— повторяющиеся запуски агента, переживающие рестарты. - Авто-активация MCP-возможностей по намерению — инструменты включаются, когда они нужны разговору, и выключаются, когда нет.
- Гейтинг агентов по домену — возможности фильтруются под то, что декларирует домен агента.
- Персистентный векторный кеш + локальный embedding-движок — преэмбеденные векторы грузятся на старте; никакого холодного пути на первом вызове.
- Параллельные вызовы инструментов по умолчанию — модель теперь явно инструктируется батчить независимые вызовы в одном ходу.
- Slash-команда
/effort— подключена прямо к плумбингу reasoning-effort в Octolib 0.21.x. - Локальные инструменты проекта по shebang — кидайте скрипт в
.agents/tools/— и это MCP-инструмент. Без регистрации, без манифеста. - Отчёт об использовании токенов и стоимости ACP — каждый хост, говорящий на ACP (Octorun, Octoweb, ваш UI), получает cost-метаданные на сообщение из коробки.
- Keepalive prompt-кеша — тот же плумбинг, что в Octolib, выставлен как сетинг сессии.
Мелочи складываются: непрерывный левый рельс для ввода пользователя, персистентная status-line с дельтой стоимости, подсветка отправленного ввода в истории, починены дедлоки рендера терминала, подавлен эхо Ctrl+C. Чат в 0.29.0 заметно спокойнее, чем в 0.25.0.
Как они стыкуются
Стек не менялся. Всё внутри — да:
- Octolib 0.21.5 — каждый LLM-вызов, с reasoning effort и prompt cache keepalive
- Octobrain 0.6.1 — персистентная память между сессиями
- Octofs 0.4.3 — безопасный доступ к файловой системе с regex-поиском и командой
delete - Octocode — семантический + структурный поиск кода (0.14.1 в проде)
- Octomind 0.29.0 — runtime, который всё это оркеструет
Одиночные бинарники, Apache-2.0, все. И все сдвинулись.
Уже начали следующий. Если что-то здесь разблокирует то, что вы хотели построить, откройте issue — фичи, запрошенные в мае, склонны выходить в июне.
— Don


