Moonborn — Developers

Im Inneren der sechsstufigen Generation-Pipeline

Was zwischen `POST /v1/personas` und der Response passiert — sechs Steps, zwei LLMs, ein Audit-Pass und die Post-Generation-Jobs, die die Response nicht blocken.

Ein einzelner API-Call generiert in 30–90 Sekunden eine vierschichtige Persona. Intern sind das sechs sichtbare Steps + zwei Post-Generation-Jobs. Hier ist, was jeder tut.

1. Intent-Parse

Das Brief des Nutzers — ein free-form-Satz — wird in ein kleines strukturiertes Objekt geparst: Genre-Hints, Locale, tonale Achsen- Präferenzen. Der Intent-String selbst bleibt unberührt; das geparste Objekt ist eine Constraint-Chain für die nachfolgenden Steps.

Modell: claude-sonnet-4-6 (konfigurierbar). Kosten: ~$0.001.

2. Soul-Draft

Die tiefste Schicht zuerst. Der Soul-Prompt fragt nach Desire, Fear, Wound und Growth-Arc — die Dinge, die einen Charakter ungeschützt wie sich selbst fühlen lassen. Wir nutzen hier Opus mit Absicht: der Soul-Draft ist der tragende Step; daran zu sparen kaskadiert in flache Downstream-Layer.

Modell: claude-opus-4-7 (konfigurierbar). Kosten: ~$0.04.

3. Self-Enrich

Mit Soul in der Hand füllt Self psychometrische Struktur aus: Big Five, Archetypus, Werte, Attachment-Style. Der Prompt ist stark durch Soul constraint — eine Persona, deren Soul „als gewöhnlich gesehen werden" ist, kann keinen 0.95-Extraversion-Score haben.

Modell: claude-sonnet-4-6. Kosten: ~$0.005.

4. Mask-Build

Die nutzerseitige Stimme. Register, Ton, Signature-Phrases, soziale Rolle. Mask ist durch sowohl Soul als auch Self constraint — eine Soul von „anerkennungssuchend" + Self mit hoher Agreeableness produziert eine Mask, die hedget, weichmacht, vor der Behauptung fragt.

Modell: claude-sonnet-4-6. Kosten: ~$0.005.

5. Surface-Ground

Name, Alter, Standort, Beruf, Erscheinung. Die demografischste Schicht, zuletzt generiert, sodass sie sich in den vorigen drei erdet, statt sich an einem demografischen Klischee zu ankern. (Wenn wir Surface zuerst schreiben, ankert das Modell auf „Gründer

Istanbul" und füllt den Rest zurück, um zum Stereotyp zu passen.)

Modell: claude-sonnet-4-6. Kosten: ~$0.004.

6. Audit

Ein zweiter Opus-Call liest das volle vierschichtige Dokument und scort es auf Coherence, Depth, Cultural Fidelity, Voice Distinctiveness und Realism. Score unter 3.5/5 → Pipeline retry't (bis zu 3-mal). Nach drei Retries versendet die Persona im flagged-Status.

Modell: claude-opus-4-7. Kosten: ~$0.03.

Total

End-to-End: ~$0.08 pro Persona, 30–90 Sekunden. Vergleiche mit naiver Single-Call-Generation: ~$0.01, 5 Sekunden, kein Audit, keine Constraint-Chain, Persona ist flach.

Post-Generation-Jobs

Zwei Jobs laufen asynchron nach Rückgabe der API-Response. Die Persona ist sofort nutzbar; diese fügen Metadata hinzu.

Voice-Fingerprint

Fünfzig kurze Szenarien laufen durch die Persona, Embeddings zu einem einzelnen Vektor gemittelt. Genutzt für Drift-Detection auf jeder nachfolgenden Chat-Antwort. Siehe Wie Drift-Detection funktioniert.

Kosten: ~$0.03. Zeit: ~60 Sekunden. Läuft als Background-Job; Webhook-Event persona.fingerprint.ready feuert, wenn fertig.

Provokationstest-Suite

Der 33-Test-Katalog läuft gegen die Persona — Role-Breaking, Widersprüche, Emotional Load, Jailbreak-Versuche. Aggregate Pass- Rate gespeichert neben dem Audit-Verdict. Siehe Audit + provocation tests.

Kosten: ~$0.10. Zeit: ~3 Minuten. Async; persona.test_suite_complete-Event feuert, wenn fertig.

Die sichtbaren Sechs streamen

Übergib stream: true und die Response wird SSE. Jeder Step emittiert step.started- und step.completed-Events mit Timing- Metadata. Nutze das, um Progress-UI ohne Polling zu bauen.

Konfiguration

Modell, Temperature, max_tokens und Fallback-Chain jedes Steps sind als Config-Item unter engine.pipeline.<step>.* belichtet. Org- Admins können Provider swappen (Anthropic → OpenAI → Google), Per- Workspace-Overrides setzen, spezifische Items locken, den ganzen Tree snapshotten + rollbacken.

Die Defaults (opus für Soul + Audit, sonnet für die Mitte) sind das Ergebnis interner A/B-Läufe zu Persona-Qualität. Wir empfehlen nicht, ohne eigene Evaluation abzuweichen; das Audit fängt offen- sichtliche Regressions, aber subtile können durchrutschen.

Ehrlicher Scope

Das ist die Produktions-Pipeline. Variationen leben in unserem Forschungs-Branch (andere Soul-Prompts, andere Audit-Rubriken, andere Fingerprint-Szenarien), aber der kundenseitige Vertrag ist die sechs Steps + zwei Jobs. Änderungen propagieren durch die Regressions-Suite des Audits vor dem Versenden.