Uzun-vadeli bellek
Persona-scope'lu bellek: kısa-vadeli context, uzun-vadeli pgvector retrieval ve oturumları context penceresini patlatmadan temellendirilmiş tutan cold-tier rotasyonu.
Sohbet oturumları birikir. Uzun bir destek konuşması, çok-haftalı bir araştırma paneli, çok-haftalı bir yaratıcı yazım projesi — hepsi modelin çalışan context'ini aşar. Moonborn'un bellek katmanı bunu üç katmanla ele alır.
Kısa vadeli: aktif pencere
Son N tur prompt'ta olduğu gibi taşınır,
chat.memory.short_term.window_turns (varsayılan 12) tarafından
yönetilir. Bu en hızlı, en yüksek-yoğunluklu bellek — LLM'in
dikkatinin içindedir.
Uzun vadeli: pgvector retrieval
Önceki turlar özetlenir ve voyage-3-large ile gömlü (varsayılan;
engine.embedding.model üzerinden yapılandırılabilir). Her yeni
turda runtime hybrid arama ile en alakalı K parçayı alır:
- Semantic (cosine mesafe, pgvector).
- BM25 sözlüksel eşleme (Postgres
tsvector). - Rerank çapraz-encoder ile.
- MMR (Maximum Marginal Relevance) tekrarı önler.
chat.memory.long_term.{top_k, retrieval_strategy} ile ayarlanır.
Soğuk katman
chat.memory.long_term.cold_tier_after_days (varsayılan 90)
gününden eski parçalar daha yavaş bir depolama sınıfına geçer.
Sorgulanabilir kalırlar, ancak kullanıcı daha eski bir şeye açıkça
atıfta bulunmadıkça retrieval geçişi onları atlar.
Kullanıcı tetikli unutma
GDPR + ürün UX ikisi de bunu istiyor:
DELETE /v1/chat/sessions/{id}/memory/{chunk_id} bir bellek
parçasını kaldırır. Persona o belirli gerçeği oturum için unutur
(diğer oturumlar etkilenmez — bellek oturum-scope, persona-scope
değil).
API
GET /v1/chat/sessions/{id}/memory— bellek parçalarını listele.DELETE /v1/chat/sessions/{id}/memory/{chunk_id}— unut.POST /v1/chat/sessions/{id}/memory/summarize— özetlemeyi manuel tetikle (nadir; varsayılan olarak otomatik çalışır).
Tarife
Kısa-vadeli: Free ve üzeri. Uzun-vadeli retrieval + soğuk katman: Pro ve üzeri (yüksek tarifeler daha büyük retention pencereleri + daha büyük parça sınırları alır).
Dürüst kapsam
Bellek varsayılan olarak oturum-scope'ludur. Bir persona, bunu
sen wire etmedikçe oturumlar arası hatırlamaz —
chat.memory.cross_session.enabled opt-in flag'i (Team+) ve karmaşık
gizlilik + provenans endişeleri getirir. Açmadan önce
bellek yapılandırma kılavuzunu oku.