Im Inneren der sechsstufigen Generation-Pipeline
Was zwischen `POST /v1/personas` und der Response passiert — sechs Steps, zwei LLMs, ein Audit-Pass und die Post-Generation-Jobs, die die Response nicht blocken.
Ein einzelner API-Call generiert in 30–90 Sekunden eine vierschichtige Persona. Intern sind das sechs sichtbare Steps + zwei Post-Generation-Jobs. Hier ist, was jeder tut.
1. Intent-Parse
Das Brief des Nutzers — ein free-form-Satz — wird in ein kleines strukturiertes Objekt geparst: Genre-Hints, Locale, tonale Achsen- Präferenzen. Der Intent-String selbst bleibt unberührt; das geparste Objekt ist eine Constraint-Chain für die nachfolgenden Steps.
Modell: claude-sonnet-4-6 (konfigurierbar). Kosten: ~$0.001.
2. Soul-Draft
Die tiefste Schicht zuerst. Der Soul-Prompt fragt nach Desire, Fear, Wound und Growth-Arc — die Dinge, die einen Charakter ungeschützt wie sich selbst fühlen lassen. Wir nutzen hier Opus mit Absicht: der Soul-Draft ist der tragende Step; daran zu sparen kaskadiert in flache Downstream-Layer.
Modell: claude-opus-4-7 (konfigurierbar). Kosten: ~$0.04.
3. Self-Enrich
Mit Soul in der Hand füllt Self psychometrische Struktur aus: Big Five, Archetypus, Werte, Attachment-Style. Der Prompt ist stark durch Soul constraint — eine Persona, deren Soul „als gewöhnlich gesehen werden" ist, kann keinen 0.95-Extraversion-Score haben.
Modell: claude-sonnet-4-6. Kosten: ~$0.005.
4. Mask-Build
Die nutzerseitige Stimme. Register, Ton, Signature-Phrases, soziale Rolle. Mask ist durch sowohl Soul als auch Self constraint — eine Soul von „anerkennungssuchend" + Self mit hoher Agreeableness produziert eine Mask, die hedget, weichmacht, vor der Behauptung fragt.
Modell: claude-sonnet-4-6. Kosten: ~$0.005.
5. Surface-Ground
Name, Alter, Standort, Beruf, Erscheinung. Die demografischste Schicht, zuletzt generiert, sodass sie sich in den vorigen drei erdet, statt sich an einem demografischen Klischee zu ankern. (Wenn wir Surface zuerst schreiben, ankert das Modell auf „Gründer
- Istanbul" und füllt den Rest zurück, um zum Stereotyp zu passen.)
Modell: claude-sonnet-4-6. Kosten: ~$0.004.
6. Audit
Ein zweiter Opus-Call liest das volle vierschichtige Dokument und
scort es auf Coherence, Depth, Cultural Fidelity, Voice
Distinctiveness und Realism. Score unter 3.5/5 → Pipeline retry't
(bis zu 3-mal). Nach drei Retries versendet die Persona im
flagged-Status.
Modell: claude-opus-4-7. Kosten: ~$0.03.
Total
End-to-End: ~$0.08 pro Persona, 30–90 Sekunden. Vergleiche mit naiver Single-Call-Generation: ~$0.01, 5 Sekunden, kein Audit, keine Constraint-Chain, Persona ist flach.
Post-Generation-Jobs
Zwei Jobs laufen asynchron nach Rückgabe der API-Response. Die Persona ist sofort nutzbar; diese fügen Metadata hinzu.
Voice-Fingerprint
Fünfzig kurze Szenarien laufen durch die Persona, Embeddings zu einem einzelnen Vektor gemittelt. Genutzt für Drift-Detection auf jeder nachfolgenden Chat-Antwort. Siehe Wie Drift-Detection funktioniert.
Kosten: ~$0.03. Zeit: ~60 Sekunden. Läuft als Background-Job;
Webhook-Event persona.fingerprint.ready feuert, wenn fertig.
Provokationstest-Suite
Der 33-Test-Katalog läuft gegen die Persona — Role-Breaking, Widersprüche, Emotional Load, Jailbreak-Versuche. Aggregate Pass- Rate gespeichert neben dem Audit-Verdict. Siehe Audit + provocation tests.
Kosten: ~$0.10. Zeit: ~3 Minuten. Async;
persona.test_suite_complete-Event feuert, wenn fertig.
Die sichtbaren Sechs streamen
Übergib stream: true und die Response wird SSE. Jeder Step
emittiert step.started- und step.completed-Events mit Timing-
Metadata. Nutze das, um Progress-UI ohne Polling zu bauen.
Konfiguration
Modell, Temperature, max_tokens und Fallback-Chain jedes Steps sind
als Config-Item unter engine.pipeline.<step>.* belichtet. Org-
Admins können Provider swappen (Anthropic → OpenAI → Google), Per-
Workspace-Overrides setzen, spezifische Items locken, den ganzen
Tree snapshotten + rollbacken.
Die Defaults (opus für Soul + Audit, sonnet für die Mitte) sind
das Ergebnis interner A/B-Läufe zu Persona-Qualität. Wir empfehlen
nicht, ohne eigene Evaluation abzuweichen; das Audit fängt offen-
sichtliche Regressions, aber subtile können durchrutschen.
Ehrlicher Scope
Das ist die Produktions-Pipeline. Variationen leben in unserem Forschungs-Branch (andere Soul-Prompts, andere Audit-Rubriken, andere Fingerprint-Szenarien), aber der kundenseitige Vertrag ist die sechs Steps + zwei Jobs. Änderungen propagieren durch die Regressions-Suite des Audits vor dem Versenden.