FAQ
Preise, Datenverarbeitung, Latenz, Datenresidenz, Sprachen und On-Prem. Wenn deine Frage nicht dabei ist, schreib uns einfach.
Preise und Limits
Was ist in Free enthalten?
Generierung mit einem begrenzten Kontingent, Modus nur für öffentliche Personas und Basis-Chat ohne drift-Gating. Der OpenAI-kompatible Endpunkt ist aktiv. Die vollständige Aufschlüsselung findest du unter Tarife.
Wie wird die Nutzung gemessen — Tokens, Sitze oder Generierungen?
Das hängt von der Oberfläche ab. Generierung wird pro erstellter Persona und pro refine-Aufruf abgerechnet. Chat wird pro Token (Input + Output) abgerechnet. Kollaboration läuft pro Sitz über der im Tarif enthaltenen Anzahl. API-Aufrufe fließen in das Rate Limit des Workspace ein.
Gibt es einen Jahresrabatt?
Ja. Eine jährliche Vorauszahlung senkt den monatlichen Tarif bei Pro, Team und Enterprise um einen spürbaren Prozentsatz. Siehe moonborn.co/pricing.
Kann ich jederzeit kündigen?
Ja. Self-Service unter Settings → Billing. Downgrades werden zum Ende des aktuellen Abrechnungszyklus wirksam; Daten werden gemäß den Aufbewahrungsregeln deines neuen Tarifs vorgehalten.
Daten und Compliance
Werden meine Daten zum Modelltraining genutzt?
Nein. Kundendaten — Prompts, Completions, Persona-Definitionen, Chatverlauf — werden niemals zum Training irgendeines Modells verwendet. Kundendaten sind pro Organisation isoliert und überschreiten niemals Tenant-Grenzen.
Wo werden Daten gespeichert? Kann ich eine Region wählen?
Produktionsdaten werden entweder in den USA oder in der EU gespeichert. Die Region wird beim Signup gewählt und danach gesperrt; regionübergreifende Lesezugriffe werden auf Datenbankebene blockiert. Enterprise-Kunden erhalten eine schriftliche Zusicherung zur Datenresidenz.
Habt ihr SOC 2 / DSGVO / HIPAA?
DSGVO — ja; wir sind für Marketingdaten der Verantwortliche und für Kundendaten der Auftragsverarbeiter. SOC 2 — Typ II in Arbeit; den Bericht veröffentlichen wir nach Abschluss. HIPAA — auf Anfrage in Enterprise-Verträgen verfügbar.
Performance
Wie hoch ist die typische First-Token-Latenz?
300–800 ms p50 für Streaming-Chat, abhängig vom Upstream-Modell und der Workspace-Region. Die Persona-Generierung läuft asynchron (eine mehrstufige Pipeline) und meldet den Fortschritt per SSE; Ende-zu-Ende sind 6–15 Sekunden zu erwarten.
Anpassung
Kann ich Moonborn on-prem betreiben?
Self-hosted Moonborn ist eine Enterprise-Option. Das Artefakt wird als containerisierter Stack ausgeliefert; Compute, Storage und einen LLM-Anbieter stellst du selbst (oder nutzt unseren über einen Private Link). Kontaktiere den Vertrieb für das Dossier.
Sprachen
Welche Sprachen unterstützen Personas?
Personas deklarieren ein ISO-639-1-Sprachkürzel, und die Generierungs-Pipeline unterstützt ein breites Spektrum. Englisch, Türkisch, Deutsch, Spanisch, Französisch und Portugiesisch sind erstklassig — die drift-Detection hat für diese Sprachen sprachspezifische Baselines. Andere Sprachen funktionieren ebenfalls und werden kontinuierlich kalibriert.
Noch eine Frage offen?
Schreib an hello@moonborn.co oder eröffne eine Diskussion auf unserem GitHub.