Uygulamayı aç
Moonborn — Developers

Uzun-vadeli bellek

Persona-scope'lu bellek: kısa-vadeli context, uzun-vadeli pgvector retrieval ve oturumları context penceresini patlatmadan temellendirilmiş tutan cold-tier rotasyonu.

Sohbet oturumları birikir. Uzun bir destek konuşması, çok-haftalı bir araştırma paneli, çok-haftalı bir yaratıcı yazım projesi — hepsi modelin çalışan context'ini aşar. Moonborn'un bellek katmanı bunu üç katmanla ele alır.

Kısa vadeli: aktif pencere

Son N tur prompt'ta olduğu gibi taşınır, chat.memory.short_term.window_turns (varsayılan 12) tarafından yönetilir. Bu en hızlı, en yüksek-yoğunluklu bellek — LLM'in dikkatinin içindedir.

Uzun vadeli: pgvector retrieval

Önceki turlar özetlenir ve voyage-3-large ile gömlü (varsayılan; engine.embedding.model üzerinden yapılandırılabilir). Her yeni turda runtime hybrid arama ile en alakalı K parçayı alır:

  • Semantic (cosine mesafe, pgvector).
  • BM25 sözlüksel eşleme (Postgres tsvector).
  • Rerank çapraz-encoder ile.
  • MMR (Maximum Marginal Relevance) tekrarı önler.

chat.memory.long_term.{top_k, retrieval_strategy} ile ayarlanır.

Soğuk katman

chat.memory.long_term.cold_tier_after_days (varsayılan 90) gününden eski parçalar daha yavaş bir depolama sınıfına geçer. Sorgulanabilir kalırlar, ancak kullanıcı daha eski bir şeye açıkça atıfta bulunmadıkça retrieval geçişi onları atlar.

Kullanıcı tetikli unutma

GDPR + ürün UX ikisi de bunu istiyor: DELETE /v1/chat/sessions/{id}/memory/{chunk_id} bir bellek parçasını kaldırır. Persona o belirli gerçeği oturum için unutur (diğer oturumlar etkilenmez — bellek oturum-scope, persona-scope değil).

API

  • GET /v1/chat/sessions/{id}/memory — bellek parçalarını listele.
  • DELETE /v1/chat/sessions/{id}/memory/{chunk_id} — unut.
  • POST /v1/chat/sessions/{id}/memory/summarize — özetlemeyi manuel tetikle (nadir; varsayılan olarak otomatik çalışır).

Tarife

Kısa-vadeli: Free ve üzeri. Uzun-vadeli retrieval + soğuk katman: Pro ve üzeri (yüksek tarifeler daha büyük retention pencereleri + daha büyük parça sınırları alır).

Dürüst kapsam

Bellek varsayılan olarak oturum-scope'ludur. Bir persona, bunu sen wire etmedikçe oturumlar arası hatırlamaz — chat.memory.cross_session.enabled opt-in flag'i (Team+) ve karmaşık gizlilik + provenans endişeleri getirir. Açmadan önce bellek yapılandırma kılavuzunu oku.