ถึงเวลา release
สองสัปดาห์ก่อนเราเปิดตัว Octofs, Octobrain, Octolib และ Octomind cloud preview ตั้งแต่นั้น แต่ละตัวออก release อย่างน้อยหนึ่งครั้ง ส่วนใหญ่หลายครั้ง
Octofs 0.4.3 — regex search, parallel walking และคำสั่ง delete
github.com/muvon/octofs · 0.4.0 → 0.4.3
MCP filesystem server ที่เราเปิดตัวเมื่อวันที่ 3 พฤษภาคม สร้างขึ้นรอบสัญญาหนึ่ง: จับ failure modes ที่ AI agents สร้างขึ้นเมื่อแตะโค้ด สาย patch 0.4.x ขันแน่นอีกขึ้น
ใหม่ตั้งแต่ 0.4.0:
- Regex content search.
viewตอนนี้รับ regex pattern นอกเหนือจาก literal strings เอเจนต์ที่ต้องหา call sites, references หรือ structural matches ไม่ต้องถอยไปใช้shell+ ripgrep — มันเป็นโหมดค้นหาระดับเดียวกัน - Parallel file walking. Directory traversal ตอนนี้ multi-threaded ด้วย shared worker pool monorepo ใหญ่ที่เคยใช้วินาทีในการ index ตอนนี้ตอบในร้อยมิลลิวินาที ยังคงรู้ gitignore ในทุกไดเรกทอรี
- คำสั่ง
deleteในtext_editor. เอเจนต์ลบ lines, ranges หรือไฟล์แบบ atomic ผ่านเครื่องมือเดียวกับที่ใช้แก้ — ไม่ต้อง shell ไปใช้rmสัญญา atomic-write เดิม: ไฟล์อยู่หรือไม่อยู่ ไม่มีอยู่ระหว่าง - รักษาสิทธิ์ไฟล์ใน
atomic_write. ก่อน 0.4.2 การเขียนจะ reset file mode เป็น umask default แบบเงียบ การแก้ executable script และเสีย+xbit ทำให้พัง แก้แล้ว: อ่านสิทธิ์ก่อนเขียน temp file และใส่ก่อน rename - Stable lock keys สำหรับไฟล์ที่ไม่มีอยู่. การสร้างพร้อมกันกับ path aliasing (
./a.rsvsa.rs) เคยเป็น race ตอนนี้ทั้งคู่แก้ไปยัง canonical lock เดียวกันก่อนที่ไฟล์จะมีอยู่ - JSON-encoded array params. ลูกค้า MCP บางรายต่อ array arguments เป็น JSON strings Octofs ตอนนี้รับทั้งสองรูปแบบโปร่งใส ดังนั้นเอเจนต์เลิกล้มเหลวกับ
"[[1,50]]"vs[[1,50]]mismatch
ถ้าคุณอยู่บน 0.4.0 ปรับเป็น 0.4.3 ได้โดยไม่ต้องเปลี่ยน config โหมด line แบบ hash, fuzzy matching, batch conflict detection — ยังอยู่ครบ เพียงเร็วและคมขึ้น
cargo install octofs --version 0.4.3
# หรือดาวน์โหลด binary ที่ https://github.com/muvon/octofs/releases
Octobrain 0.6.1 — release เงียบบน release ดัง
github.com/muvon/octobrain · 0.6.0 → 0.6.1
0.6.0 คือตัวใหญ่ — full document reading ผ่าน knowledge read, regex match บนเนื้อหา indexed, streaming query results และเครื่องมือ auto_link ถูกลบในที่สุด 0.6.1 คือรอบบำรุงรักษาด้านบน: อัปเกรด dependency และ release profile ที่ปรับแต่งให้ลดขนาด binary และลดมิลลิวินาที cold start
ไม่มีอะไรใน 0.6.1 ที่เปลี่ยน API ถ้าคุณส่ง 0.6.0 ไปแล้ว นี่คือ drop-in upgrade ถ้ายังไม่ โพสต์ release 0.6.0 อธิบายว่า read และ match ทำอะไรจริงๆ — และทำไม "ความจำ" ของ AI ของคุณควรรวมเอกสารที่อ่าน ไม่ใช่แค่บทสนทนาที่มี
Octolib 0.21.5 — reasoning effort, prompt cache keepalive, ผู้ให้บริการใหม่สองราย
github.com/muvon/octolib · 0.19.0 → 0.21.5
Octolib คือเครื่องยนต์เบื้องหลังทุก LLM call ที่เราทำ — Octomind, Octocode, Octofs, agent ใน production, สคริปต์ใน terminal ของเรา ตั้งแต่โพสต์เปิดตัวเมื่อ 27 เมษายน มันไปจาก 0.19.0 ถึง 0.21.5 หกเวอร์ชันรอง สิบสอง patch release นี่คือสิ่งที่เปลี่ยน:
- Reasoning effort ข้ามผู้ให้บริการ. พารามิเตอร์
effortรวมเป็นหนึ่งที่ map ไปยัง adaptive thinking ของ Anthropic, reasoning tiers ของ OpenAI และปุ่มเทียบเท่าในทุกผู้ให้บริการที่รองรับ หนึ่ง call ทุก backend คำสั่ง/effortใน Octomind เชื่อมตรงนี้ - Anthropic adaptive thinking. ส่ง
effort = "high"แล้ว Claude จัดสรร thinking budget มากขึ้น;"low"ทำให้เร็ว ราคา per-TTL cache creation ตอนนี้ก็คำนวณถูกต้อง - นโยบาย prompt cache keepalive. เอเจนต์ที่รันนานเสีย cached prompts เพราะ TTL 5 นาทีหมดอายุระหว่าง tool calls Octolib ตอนนี้รักษา cache ให้อุ่นด้วย background heartbeat ผล: บทสนทนาถูกลงหลายเท่าเมื่อ context ถูกสร้างแล้ว
- ผู้ให้บริการใหม่สองราย.
- Fireworks AI — OSS inference เร็วสำหรับ Llama, Qwen, Mixtral
- Featherless — โมเดล community-hosted คิดเงินต่อ token
- DeepSeek tool calling. รูปแบบ tool-call ของ DeepSeek ไม่มาตรฐาน; Octolib ตอนนี้ parse ได้ถูกและรองรับ thinking + tool-use loop เต็ม
- แนบรูปและวิดีโอผ่าน URL. ก่อนต้อง base64 media; ตอนนี้ provider-aware URL passthrough เป็นค่าเริ่มต้นที่รองรับ
- HuggingFace reranker ผ่าน XLM-RoBERTa. Cross-encoder reranking แบบหลายภาษาบน dense + sparse retrieval เดิม normalize ด้วย Sigmoid
- HTTP/2 keep-alive + compression ทุก call ขาออก. ใช้ connection ซ้ำสำหรับโหลด agent throughput สูง Retry บน stale connection Tail latency ต่ำลงภายใต้โหลดต่อเนื่อง
ถ้าคุณสร้างอะไรที่เรียก LLM จาก Rust นี่คือ layer ที่ควรมาตรฐาน Anthropic, OpenAI, Google Gemini, DeepSeek, Moonshot, MiniMax, Z.ai, OpenRouter, NVIDIA NIM, Cerebras, Together, Cloudflare Workers AI, Fireworks, Featherless, Ollama, custom endpoints — trait เดียวกัน retry logic เดียวกัน cost accounting เดียวกัน
Octomind 0.29.0 — ห้า release ในสามสัปดาห์
github.com/muvon/octomind · 0.25.0 → 0.29.0
Agent runtime ถึง 0.29.0 วันนี้ ห้า release ในสามสัปดาห์ — จังหวะนี้ไม่ได้วางแผน มันคือ cloud preview ที่เผยให้เห็นสิ่งที่ต้องแก้แบบเรียลไทม์ เราแก้ เรื่องเต็มที่ octomind.run; รายการสั้น:
- Schedule persistence และคำสั่ง
/schedule— agent run ที่ทำซ้ำและรอด restart - Intent-based MCP capability auto-activation — เครื่องมือเปิดตัวเมื่อบทสนทนาต้องการ ปิดเมื่อไม่
- Domain-based agent gating — capability ถูกกรองตามที่ domain ของ agent ประกาศต้องการ
- Persistent vector cache + local embedding engine — vectors pre-embedded โหลดตอนเริ่ม; ไม่มี cold path เรียกแรก
- Parallel tool calls โดยค่าเริ่มต้น — โมเดลถูกสั่งชัดเจนให้รวม call อิสระในรอบเดียว
- คำสั่ง
/effort— เชื่อมตรงกับ plumbing reasoning-effort ใน Octolib 0.21.x - Project-local shebang tools — วาง script ใน
.agents/tools/แล้วเป็นเครื่องมือ MCP ไม่ต้องลงทะเบียน ไม่ต้องมี manifest - ACP token usage และ cost reporting — host ที่พูด ACP (Octorun, Octoweb, UI ของคุณ) ได้ cost meta ต่อข้อความ out of the box
- Prompt cache keepalive — plumbing เดียวกับ Octolib เปิดเป็น session-level setting
เรื่องเล็กรวมกัน: left rail ต่อเนื่องสำหรับ input ผู้ใช้, status line ถาวรพร้อม delta ราคา, input ที่ส่งไฮไลต์ในประวัติ, แก้ deadlock การ render terminal, ระงับ echo Ctrl+C ประสบการณ์แชทใน 0.29.0 สงบขึ้นชัดเจนกว่า 0.25.0
พวกมันเข้ากันอย่างไร
Stack ไม่เปลี่ยน ทุกอย่างในนั้นเปลี่ยน:
- Octolib 0.21.5 — ทุก LLM call พร้อม reasoning effort และ prompt cache keepalive
- Octobrain 0.6.1 — ความจำถาวรข้าม session
- Octofs 0.4.3 — เข้าถึง filesystem อย่างปลอดภัยพร้อม regex search และคำสั่ง
delete - Octocode — semantic + structural code search (0.14.1 ในตลาด)
- Octomind 0.29.0 — runtime ที่ orchestrate ทุกอย่าง
บาง binary, Apache-2.0, ทั้งหมด และทั้งหมดเคลื่อนไหว
เราเริ่มตัวถัดไปแล้ว ถ้าอะไรที่นี่ปลดล็อกสิ่งที่คุณอยากสร้าง เปิด issue — feature ที่ขอในพฤษภาคมมักจะ ship ในมิถุนายน
— Don


