रिलीज़ का समय।
दो हफ्ते पहले हमने Octofs, Octobrain, Octolib, और Octomind cloud preview पेश किए थे। तब से हर एक ने कम से कम एक रिलीज़ शिप की है — ज़्यादातर ने कई।
Octofs 0.4.3 — regex सर्च, parallel walking, और delete कमांड
github.com/muvon/octofs · 0.4.0 → 0.4.3
3 मई को पेश किया गया MCP फ़ाइलसिस्टम सर्वर एक वादे पर बना है: कोड को छूते समय AI एजेंट जो failure modes बनाते हैं उन्हें पकड़ना। 0.4.x पैच लाइन उस पकड़ को कसती जा रही है।
0.4.0 के बाद नया क्या:
- Regex कंटेंट सर्च।
viewअब लिटरल स्ट्रिंग के साथ-साथ regex pattern स्वीकार करता है। जिन एजेंटों को call sites, references, या structural matches ढूँढने हों उन्हेंshell+ ripgrep पर वापस नहीं जाना — यह पहले दर्जे का सर्च मोड है। - Parallel file walking। डायरेक्ट्री ट्रैवर्सल अब साझा वर्कर पूल के साथ मल्टी-थ्रेडेड है। बड़े मोनोरेपो जो सेकंड में इंडेक्स होते थे अब सैकड़ों मिलीसेकंड में जवाब देते हैं। हर डायरेक्ट्री पर gitignore-aware अभी भी है।
text_editorमेंdeleteकमांड। एजेंट अब उसी टूल से लाइनें, रेंज, या फाइलें परमाणु रूप से डिलीट कर सकते हैं जिससे संपादन करते हैं —rmको शेल आउट करने की ज़रूरत नहीं। वही atomic-write अनुबंध: फाइल या तो वहाँ है या नहीं, बीच में कभी नहीं।atomic_writeमें संरक्षित फ़ाइल अनुमतियाँ। 0.4.2 से पहले एक राइट चुपचाप फाइल मोड को umask डिफ़ॉल्ट पर रीसेट कर देता था। एक्ज़ेक्यूटेबल स्क्रिप्ट एडिट करना और+xबिट खोना चीज़ें तोड़ता था। ठीक: temp फाइल राइट से पहले अनुमतियाँ पढ़ी जाती हैं और rename से पहले लागू।- गैर-मौजूद फाइलों के लिए स्थिर lock keys। पाथ aliasing (
./a.rsबनामa.rs) के साथ समानांतर create एक race थी। अब दोनों फाइल बनने से पहले एक ही canonical lock पर हल होते हैं। - JSON-encoded array params। कुछ MCP क्लाइंट array आर्ग्युमेंट्स को JSON स्ट्रिंग के रूप में serialize करते हैं। Octofs अब दोनों रूप पारदर्शी रूप से स्वीकार करता है, तो एजेंट
"[[1,50]]"बनाम[[1,50]]मिसमैच पर फेल होना बंद कर देते हैं।
अगर 0.4.0 पर थे — कॉन्फिग चेंज के बिना 0.4.3 पर ड्रॉप कर सकते हैं। Hash-based line mode, fuzzy matching, batch conflict detection — सब अभी भी वहाँ, बस तेज़ और तीखे किनारों के साथ।
cargo install octofs --version 0.4.3
# या https://github.com/muvon/octofs/releases से बाइनरी लें
Octobrain 0.6.1 — एक शोर भरे के ऊपर एक शांत रिलीज़
github.com/muvon/octobrain · 0.6.0 → 0.6.1
0.6.0 बड़ा था — knowledge read से पूर्ण डॉक्यूमेंट पठन, indexed कंटेंट पर regex match, स्ट्रीमिंग क्वेरी रिज़ल्ट, और auto_link टूल अंततः हटाया गया। 0.6.1 इसके ऊपर रखरखाव पास है: dependency upgrades और एक tuned release profile जो binary size कम करता है और cold starts से मिलीसेकंड बचाता है।
0.6.1 में कुछ भी API बदलता नहीं है। अगर आपने पहले ही 0.6.0 अपने स्टैक में भेज दिया है, यह drop-in अपग्रेड है। अगर नहीं किया, 0.6.0 रिलीज़ पोस्ट बताती है कि read और match कमांड वास्तव में क्या करते हैं — और आपकी AI की "मेमोरी" में सिर्फ़ बातचीत नहीं, पढ़े गए डॉक्यूमेंट भी क्यों शामिल होने चाहिए।
Octolib 0.21.5 — reasoning effort, prompt cache keepalive, दो नए प्रोवाइडर
github.com/muvon/octolib · 0.19.0 → 0.21.5
Octolib हमारे हर LLM कॉल के पीछे का इंजन है — Octomind, Octocode, Octofs, प्रोडक्शन में एजेंट, हमारे टर्मिनल में स्क्रिप्ट्स। 27 अप्रैल की intro पोस्ट से यह 0.19.0 से 0.21.5 पर पहुँचा। छह माइनर वर्ज़न, बारह पैच रिलीज़। क्या बदला:
- प्रोवाइडरों के बीच reasoning effort। एक unified
effortपैरामीटर जो Anthropic की adaptive thinking, OpenAI के reasoning tiers, और हर प्रोवाइडर की समकक्ष knobs पर मैप होता है। एक कॉल, हर बैकएंड। Octomind में/effortस्लैश कमांड सीधे इससे जुड़ती है। - Anthropic adaptive thinking।
effort = "high"पास करें और Claude ज़्यादा thinking budget देता है;"low"तेज़ रखता है। Per-TTL cache creation pricing भी अब सही तरह honour होती है। - Prompt cache keepalive नीति। लंबे चलने वाले एजेंट अपने cached prompts खोते रहते थे क्योंकि 5-मिनट का TTL टूल कॉल्स के बीच एक्सपायर हो जाता था। Octolib अब बैकग्राउंड heartbeat के साथ cache गर्म रखता है। नतीजा: एक बार context बन जाने के बाद orders-of-magnitude सस्ती बातचीत।
- दो नए प्रोवाइडर।
- Fireworks AI — Llama, Qwen, Mixtral के लिए तेज़ OSS inference।
- Featherless — pay-per-token billing के साथ community-hosted मॉडल।
- DeepSeek tool calling। DeepSeek का tool-call फ़ॉर्मेट non-standard था; Octolib अब उसे सही तरह parse करता है और पूरा thinking + tool-use loop सपोर्ट करता है।
- URL के माध्यम से image और video attachments। पहले media को base64-encode करना पड़ता था; अब provider-aware URL passthrough डिफ़ॉल्ट है जहाँ सपोर्टेड है।
- XLM-RoBERTa के माध्यम से HuggingFace reranker। मौजूदा dense + sparse retrieval के ऊपर multi-lingual cross-encoder reranking। स्कोर पर Sigmoid normalization।
- हर outgoing कॉल पर HTTP/2 keep-alive + compression। हाई-throughput एजेंट वर्कलोड के लिए connection reuse। Stale-connection retry। निरंतर लोड पर कम tail latencies।
अगर आप Rust से LLMs को कॉल करने वाला कुछ भी बना रहे हैं, यही वह layer है जिस पर standardize करें। Anthropic, OpenAI, Google Gemini, DeepSeek, Moonshot, MiniMax, Z.ai, OpenRouter, NVIDIA NIM, Cerebras, Together, Cloudflare Workers AI, Fireworks, Featherless, Ollama, custom endpoints — एक ही trait, एक ही retry logic, एक ही cost accounting।
Octomind 0.29.0 — तीन हफ्तों में पाँच रिलीज़
github.com/muvon/octomind · 0.25.0 → 0.29.0
एजेंट रनटाइम आज 0.29.0 पर पहुँचा। तीन हफ्ते में पाँच रिलीज़ — वह गति planned नहीं थी, cloud preview रियल टाइम में जो ठीक होना चाहिए था उसे सतह पर ला रहा था। हमने ठीक किया। पूरी कहानी octomind.run पर; यहाँ छोटी सूची:
- Schedule persistence और
/scheduleकमांड — रिकरिंग एजेंट रन जो रिस्टार्ट से बचते हैं। - Intent-based MCP capability auto-activation — टूल्स तब चालू होते हैं जब conversation को उनकी ज़रूरत हो, बंद जब नहीं।
- Domain-based agent gating — capabilities उसमें फ़िल्टर होती हैं जिसकी agent का domain ज़रूरत बताता है।
- Persistent vector cache + local embedding engine — स्टार्टअप पर प्री-embedded vectors लोड; पहले कॉल पर कोई cold path नहीं।
- Parallel tool calls डिफ़ॉल्ट से — मॉडल को अब स्पष्ट रूप से निर्देश है कि स्वतंत्र कॉल्स को एक turn में batch करे।
/effortslash command — Octolib 0.21.x में reasoning-effort plumbing से सीधे जुड़ी।- Project-local shebang tools —
.agents/tools/में स्क्रिप्ट डालें और यह MCP टूल है। कोई रजिस्ट्रेशन, कोई manifest नहीं। - ACP token usage और cost reporting — ACP बोलने वाला हर होस्ट (Octorun, Octoweb, आपकी अपनी UI) per-message cost meta out of the box पाता है।
- Prompt cache keepalive — वही plumbing जो Octolib में है, session-level setting के रूप में।
छोटी चीज़ें जुड़ती हैं: यूज़र इनपुट के लिए continuous left rail, cost delta के साथ persistent status line, इतिहास में highlighted submitted input, fixed terminal रेंडरिंग deadlocks, suppressed Ctrl+C echo। 0.29.0 में चैट अनुभव 0.25.0 से ध्यान देने लायक शांत है।
ये कैसे जुड़ते हैं
स्टैक नहीं बदला। उसमें सब कुछ बदला:
- Octolib 0.21.5 — हर LLM कॉल, reasoning effort और prompt cache keepalive के साथ
- Octobrain 0.6.1 — सत्रों के बीच persistent memory
- Octofs 0.4.3 — regex search और
deleteकमांड के साथ safe filesystem access - Octocode — semantic + structural code search (0.14.1 बाजार में)
- Octomind 0.29.0 — वह रनटाइम जो सब कुछ orchestrate करता है
सिंगल बाइनरी, Apache-2.0, सब। और सब आगे बढ़े।
हम पहले से अगले पर लगे हैं। अगर यहाँ कुछ आपकी रुकी चीज़ अनब्लॉक करता है, issue खोलें — मई में माँगे फीचर्स जून में शिप करने की प्रवृत्ति रखते हैं।
— Don


