Octobrain: memoria a largo plazo para asistentes de IA

Pasas una hora depurando con Claude. Exploras la base de código, tomas decisiones arquitectónicas, encuentras casos límite. Sales. ¿La siguiente sesión? Estás explicando la estructura de tu proyecto desde cero.

Así no es como debería funcionar la IA. Investigaciones de Arize muestran que el rendimiento de los LLM se degrada bruscamente más allá de los 100K tokens, incluso en modelos que anuncian ventanas de un millón de tokens. Las pruebas de Diffray descubrieron que 11 de 12 modelos cayeron por debajo del 50 % de precisión con solo 32K tokens. El efecto "perdido en el medio" entierra información en contextos largos. Y la encuesta de Qodo reveló que el 65 % de los desarrolladores citan la falta de contexto como su mayor barrera al refactorizar.

El problema no es que la IA olvide. Es que no teníamos una buena forma de hacerla recordar.

Octobrain es memoria a largo plazo para asistentes de IA. Persiste ideas, decisiones y conocimiento entre sesiones, no solo dentro de ellas. Hoy lanzamos la versión 0.5.0 con indexación local de archivos, limpieza de referencias obsoletas con conciencia de git y cumplimiento total de MCP (Model Context Protocol).

Qué hace realmente Octobrain

Octobrain se ejecuta como un servidor MCP que expone herramientas de memoria a cualquier cliente compatible: Claude Desktop, Zed, Cursor o cualquier cosa que hable MCP. También es una CLI cuando necesitas control directo.

# Iniciar el servidor MCP
octobrain mcp

# O úsalo directamente
octobrain memory memorize --title "API Pattern" \
  --content "Use REST for CRUD, GraphQL for complex queries" \
  --memory-type architecture --tags "api,design"

El servidor expone siete herramientas: memorize, remember, forget, relate, auto_link, memory_graph y knowledge_search. Tu IA almacena ideas durante la conversación, las recupera en sesiones futuras y explora las conexiones entre memorias relacionadas.

Sin archivos de resumen manuales. Sin saturar la ventana de contexto. Solo memoria que persiste.

Por qué lo construimos

No empezamos con la memoria. Empezamos con Octomind, un runtime para agentes de IA especialistas que te da un desarrollador senior en cinco segundos mediante el sistema tap: octomind run developer:general. Cero configuración, totalmente equipado.

Pero nuestros agentes seguían chocando contra el mismo muro. Pasaban horas en una tarea: explorando la base de código, tomando decisiones arquitectónicas, encontrando soluciones. Entonces la sesión terminaba. Ventana de contexto llena. La siguiente sesión empezaba desde cero. Los mismos patrones redescubiertos. Las mismas decisiones rehechas. El día de la marmota con un terminal.

Probamos las soluciones alternativas. Bancos de memoria manuales que requerían una disciplina que no teníamos. Resúmenes de sesión que perdían el matiz del porqué se tomaron las decisiones. Bases de conocimiento estáticas que quedaban obsoletas en cuanto renombrábamos un archivo. Reglas de Cursor, scripts personalizados, varias extensiones. Todas soluciones estáticas para un problema dinámico.

Así que construimos Octobrain.

Qué hacen mal las herramientas existentes

Cuando analizamos las soluciones de memoria, encontramos los mismos huecos una y otra vez:

Sistemas de una sola estrategia. La mayoría de las herramientas eligen un enfoque (búsqueda vectorial, BM25 o traversal de grafos) y eso es todo. Pero diferentes consultas necesitan diferentes estrategias. A veces necesitas similitud semántica. A veces necesitas coincidencias exactas de palabras clave. A veces necesitas recorrer relaciones. Queríamos todas, fusionadas de forma inteligente.

Importancia estática. Los sistemas existentes tratan cada memoria como igualmente importante para siempre. Así no funciona la memoria. Algunas cosas importan por un día. Otras importan por años. Necesitábamos decaimiento temporal: memorias que se desvanecen naturalmente a menos que se refuercen mediante acceso.

Acumulación de referencias muertas. Las rutas de archivos en las memorias se pudren. Refactorizas, renombras, eliminas. La mayoría de los sistemas no se dan cuenta. Las memorias persisten, apuntando a fantasmas. Necesitábamos una limpieza con conciencia de git que detecte renombrados, penalice referencias obsoletas y elimine lo verdaderamente caduco.

Sin relaciones. El conocimiento real está conectado. Una decisión implica dependencias. Una corrección de bug sustituye a una solución alternativa. Un patrón implementa una arquitectura. Necesitábamos un sistema que pudiera modelar estas relaciones, no solo almacenar hechos aislados.

Los enfoques SOTA que realmente usamos

No inventamos estas técnicas. Ensamblamos lo que funciona del estado del arte, lo hicimos configurable y dejamos que el caso de uso decida.

Búsqueda híbrida con RRF nativo

Octobrain combina búsqueda full-text BM25 con similitud vectorial usando Reciprocal Rank Fusion a través del execute_hybrid() nativo de LanceDB. Es el mismo algoritmo que usan los sistemas de búsqueda en producción. Encuentras "authentication middleware" cuando buscas "auth layer", pero también encuentras coincidencias exactas cuando las necesitas.

Reranking opcional

Para recuperaciones críticas, habilita el reranker cross-encoder. Puntúa pares consulta-documento con un modelo dedicado. Mejora la precisión un 20–35 %, reduce las alucinaciones un 35 %. Desactivado por defecto porque la velocidad importa. Disponible cuando necesitas precisión.

Decaimiento temporal (estilo Ebbinghaus)

Las memorias se desvanecen. Eso no es un bug, es cómo funciona la cognición. Octobrain implementa una curva de olvido de Ebbinghaus: las memorias decaen naturalmente a menos que se accedan. Cada recuperación aumenta la importancia. Las memorias no usadas se hunden, las importantes permanecen visibles. Configura la vida media (predeterminado: 90 días) y el valor mínimo.

Auto-linking (Zettelkasten para IA)

Cuando almacenas una memoria, Octobrain encuentra memorias semánticamente similares y crea relaciones bidireccionales. El resultado es un grafo de conocimiento emergente. Consulta una memoria y obtén su contexto: memorias que la extienden, la contradicen, la implementan o dependen de ella.

Limpieza de referencias obsoletas con conciencia de git

Los sistemas de memoria acumulan referencias a archivos que ya no existen. Octobrain detecta esto al arrancar: si todos los archivos relacionados han desaparecido, la memoria se elimina. Si algunos han desaparecido, la importancia se penaliza. ¿Archivos renombrados? Los detectamos a través del historial de git y actualizamos las referencias.

Tu memoria se mantiene tan limpia como tu base de código.

Novedades de 0.5.0

Este lanzamiento refleja lo que aprendimos ejecutando memoria a escala:

Indexación local de archivos: El sistema de conocimiento ahora indexa archivos locales, no solo URLs. Apúntalo a documentación, PDFs, Markdown. Los fragmenta de forma inteligente, rastrea el contenido principal para el contexto y reindexa automáticamente cuando el contenido se vuelve obsoleto.

Almacenamiento con ámbito de sesión: Los fragmentos de conocimiento pueden tener ámbito de sesión: almacenamiento temporal que se autolimpia tras 120 horas. Para investigaciones puntuales que no deberían contaminar la memoria a largo plazo.

Tipos de memoria product y workflow: Dos nuevas categorías. product para especificaciones de funciones, requisitos y decisiones de diseño. workflow para procesos, manuales y patrones recurrentes.

SDK oficial rmcp: Migramos de una implementación MCP personalizada al SDK oficial de Rust. Mejor cumplimiento del protocolo, mejor estabilidad, mejor preparación para el futuro.

Limpieza de referencias obsoletas: Detección automática de referencias muertas a archivos, con seguimiento de renombrados de git.

Cómo encaja todo: Octomind + Octobrain

Octobrain funciona de forma independiente. Pero está diseñado para Octomind, nuestro runtime para agentes de IA especialistas.

El flujo: Octomind escribe código, toma decisiones, encuentra bugs. Cada insight se almacena en Octobrain con el hash del commit actual de git. ¿Refactorizando ese módulo tres meses después? Octomind recupera la decisión original, más memorias relacionadas, enfoques contradictorios que fueron rechazados, el razonamiento detrás de las concesiones.

La memoria se acota a tu proyecto mediante el hash de la URL remota de git. Las consultas entre proyectos funcionan cuando necesitas contexto compartido. El filtrado por rol (developer, reviewer, etc.) mantiene las perspectivas organizadas.

Octomind se encarga del agente. Octobrain se encarga de la memoria. Juntos resuelven el problema completo: una IA que realmente conoce tu dominio, a lo largo de las sesiones, sin el dolor de cabeza de la configuración.

Por qué no usamos Mem0 ni Zep

Evaluamos el espacio de la memoria antes de construir. Esto es lo que encontramos:

Mem0: Camino más rápido a producción, excelente servicio gestionado, arquitectura vectorial plana (sin relaciones de grafo). Necesitábamos el grafo.
Zep: Basado en grafos, sólido en consultas temporales, lidera el benchmark LoCoMo; arquitectura compleja, más pesada de lo que queríamos para uso local-first.
Letta: Niveles de memoria inspirados en SO, el LLM gestiona la recuperación; requiere LLM para todas las operaciones de memoria. Queríamos algo más ligero, más rápido y más predecible.

Octobrain es diferente. No estamos optimizando para un enfoque, estamos haciendo disponibles y configurables múltiples estrategias SOTA. ¿Búsqueda híbrida o vector puro? Tu elección. ¿Decaimiento temporal o importancia estática? Configurable. ¿Auto-linking o relaciones manuales? Ambas funcionan. ¿Embeddings locales o basados en API? De cualquier manera.

El objetivo no es el sistema de memoria más simple. Es el más preciso para tu caso de uso específico.

Código abierto, local-first

Octobrain tiene licencia Apache-2.0 y se ejecuta enteramente en tu máquina. Tu código, tus memorias, tus datos: nunca salen de tu sistema a menos que configures explícitamente una API de embeddings externa. Lo construimos así porque estábamos cansados de elegir entre servicios gestionados "convenientes" que requerían enviar nuestra base de código al servidor de otra persona, o soluciones DIY frágiles que se caían bajo carga.

Auto-alojar no debería significar comprometer la capacidad. Octobrain te da búsqueda híbrida de grado de producción, decaimiento temporal y grafos de relaciones, todo ejecutándose localmente, con cero exposición de datos.

Primeros pasos

# macOS vía Homebrew (recomendado)
brew install muvon/tap/octobrain

# Cualquier plataforma vía crates.io
cargo install octobrain

# Iniciar el servidor MCP
octobrain mcp

Añade a tu configuración de Claude Desktop:

{
	"mcpServers": {
		"octobrain": {
			"command": "/path/to/octobrain",
			"args": ["mcp"]
		}
	}
}

Reinicia Claude. Tu IA ya tiene memoria a largo plazo.

Preguntas frecuentes

¿Octobrain funciona con otros asistentes de IA además de Claude?

Sí. Cualquier cliente compatible con MCP funciona: Claude Desktop, Zed, Cursor, Windsurf y cualquier implementación personalizada que hable el protocolo.

¿Dónde se almacenan mis datos?

Localmente en tu máquina. Octobrain usa SQLite para el grafo y LanceDB para los vectores. Sin servicio en la nube, sin almacenamiento externo a menos que configures un proveedor de embeddings basado en API.

¿Cómo se compara esto con simplemente usar la memoria integrada de Claude?

La memoria de Claude es excelente para preferencias personales y contexto recurrente. Octobrain es para el conocimiento del proyecto: decisiones arquitectónicas, patrones de la base de código, correcciones de bugs, concesiones de diseño. Persiste entre proyectos y sobrevive a los cambios de cuenta.

¿Puedo importar notas o documentación existentes?

Sí. El sistema de conocimiento en 0.5.0 indexa archivos locales: Markdown, PDFs, archivos de texto. Apúntalo a tus documentos y los fragmenta, genera embeddings y los hace buscables.

¿Qué pasa si renombro o elimino archivos mencionados en las memorias?

Octobrain detecta esto al arrancar. Si todos los archivos relacionados han desaparecido, la memoria se elimina. Si algunos permanecen, la importancia se penaliza. Los renombrados se detectan mediante el historial de git y las referencias se actualizan automáticamente.

¿Hay una versión alojada?

No actualmente. Octobrain está diseñado local-first. Una versión alojada requeriría cambios arquitectónicos significativos y consideraciones de seguridad. Si necesitas esto, háznoslo saber.

Qué viene a continuación

Estamos experimentando con estrategias de recuperación. Representaciones multivector. Recuperación dispersa aprendida. Expansión de consultas. El espacio de la memoria evoluciona rápido: nos comprometemos a entregar lo que funciona, no lo que suena bien en un paper.

Si estás construyendo agentes de IA que necesitan recordar cosas entre sesiones, prueba Octobrain. Lo construimos porque lo necesitábamos. Si estás chocando contra el mismo muro que nosotros, puede que sea lo que tú también necesitas.

Octobrain está desarrollado por Muvon Un Limited. Código abierto bajo Apache-2.0. Consíguelo en GitHub.