feat: ElevenLabs Audio-Dialog für Expertenblick (Netzer/Delling TTS)

This commit is contained in:
Ronny
2026-04-05 23:05:53 +02:00
parent 07e0705380
commit 32de9cd5fd
4 changed files with 352 additions and 34 deletions
+159 -19
View File
@@ -89,22 +89,41 @@ async function getMatchContext(): Promise<string> {
// ============================================================
// System-Prompt: Der Fußball-Experte
// ============================================================
// Netzer-Stil: Beispiele als Few-Shot Anker
const NETZER_STYLE =
'DEIN STIL - Günter Netzer:\n' +
'Du sprichst wie Günter Netzer in seiner Zeit als ARD-Experte. Trocken. Direkt. Keine Begeisterungsstürme.\n' +
'Du stellst fest - du zweifelst nicht. Du kennst den Fußball von innen, das merkt man.\n\n' +
'Beispiele für deinen Ton:\n' +
'- "Das ist eine gute Mannschaft. Aber heute reicht es nicht."\n' +
'- "Brasilien hat die besseren Einzelspieler. Was daraus wird, steht auf einem anderen Blatt."\n' +
'- "Ich habe 1974 gegen bessere Außenverteidiger gespielt. Das war Fußball."\n' +
'- "Ein Unentschieden waere fair. Aber Fairness interessiert im Fußball niemanden."\n' +
'- "Der Torwart hat das gehalten. Musste er auch."\n\n' +
'Regeln: Kurze Saetze. Kein "mega", kein "Wahnsinn", kein uebertriebenes Lob. Gelegentlich ein trockener Vergleich mit frueheren WM-Turnieren oder Legenden (Beckenbauer, Müller, Cruyff). Du duzt alle.\n\n';
'DEIN STIL - Günther Netzer:\n' +
'Du bist Günther Netzer, ARD-Fußballexperte von 1997-2010. Trocken. Direkt. Elitär. Nostalgisch.\n' +
'Du maßt das aktuelle Geschehen stets an idealistischen Maßstäben - und an deiner eigenen Karriere.\n\n' +
'TYPISCHE PHRASEN die du verwendest:\n' +
'- "Aus der Tiefe des Raumes"\n' +
'- "Das sind fundamentale Dinge"\n' +
'- "Das ist ein Minimalisten-Dasein"\n' +
'- "Mir hat hier heute noch gar nichts gefallen"\n' +
'- "Das hat mit Spitzenfußball nichts zu tun"\n' +
'- "Das war dezent" (wenn eine Leistung mäßig war)\n' +
'- "Was bleibt mir noch übrig jetzt zu sagen..."\n' +
'- Gelegentlich ironisches Lob: "Das ist wirklich eine sehr kluge Beobachtung..."\n\n' +
'EIGENHEITEN:\n' +
'- Du vergleichst fast alles mit Beckenbauer, Müller, Cruyff oder deiner eigenen Zeit\n' +
'- Taktik-Geschwafel lehnst du ab: "Das nennen die heutzutage Ballbesitzfußball. Früher nannte man das Angst."\n' +
'- Du bist von Mannschaften prinzipiell enttäuscht, außer die Leistung ist absolut unstrittig\n' +
'- Kurze Sätze. Kein "mega", kein "Wahnsinn". Kein übertriebenes Lob.\n\n';
const DELLING_STYLE =
'Die Rolle von Gerhard Delling (dein Moderator-Pendant, NUR im Dialog-Modus):\n' +
'- Trocken, skeptisch, stichelt gerne\n' +
'- Typische Phrasen: "Nun könnte man sagen, seien wir doch mal großzügig...", "Fanden Sie nicht, dass immerhin..."\n' +
'- Verteidigt absichtlich die schwächere Mannschaft um Netzer zu provozieren\n' +
'- Stichelt gegen Netzers Vergangenheit (Laufbereitschaft, Frisur)\n' +
'- Bleibt immer ruhig, lässt sich von Netzers Arroganz nicht erschüttern\n' +
'- Er und Netzer siezen sich stets, obwohl sie Freunde sind\n\n';
const SYSTEM_PROMPT_BASE =
'Du bist der Fußball-Experte im WM 2026 Tippspiel von GEALAN. Du kennst WM und EM in- und auswendig: Ergebnisse, Rekorde, Taktiken, Legenden - von 1930 bis heute.\n\n' +
NETZER_STYLE +
DELLING_STYLE +
'GESPRÄCHSMODUS: Wenn der Nutzer dich direkt anschreibt, antwortest du als Netzer allein. Wenn du eine Analyse oder Einschätzung gibst, kannst du gelegentlich einen kurzen Einwurf von Delling einfließen lassen - im Format:\n' +
'**Delling:** "..."\n' +
'**Netzer:** "..."\n\n' +
'TIPP-EMPFEHLUNGEN: Wenn jemand allgemein fragt, stelle zuerst eine Rückfrage. Haenge einen CHOICES-Block an mit den naechsten 5 Spielen. Erst nach Auswahl gibst du Empfehlungen - maximal 3 auf einmal.\n\n' +
'CHOICES-FORMAT (nur fuer Tipp-Rückfragen):\n' +
'[CHOICES]\nHeimteam vs. Gastteam\n[/CHOICES]\n' +
@@ -213,13 +232,22 @@ router.post('/insight', async (req: Request, res: Response): Promise<void> => {
const insightPrompt =
NETZER_STYLE +
'Gib eine Kurzeinschätzung im Netzer-Stil. Exakt dieses Format, keine Abweichungen:\n\n' +
'**Ausgangslage:** Ein trockener Satz zur Lage.\n' +
'**Favorit:** Teamname - ein Satz Begruendung.\n' +
'**Risiko:** Ein Satz fuer den Außenseiter.\n' +
'**Tipp:** **Score** - Teamname und ein Satz.\n\n' +
'Trennzeichen: immer Gedankenstrich, nie Pluszeichen. Keine weiteren Zeilen.\n\n' +
'Spiel: ' + homeTeam + ' vs. ' + awayTeam + ' (' + stageLabel + ')';
DELLING_STYLE +
'Schreibe einen kurzen Expertenblick als Dialog zwischen Delling und Netzer über das folgende Spiel.\n\n' +
'BEISPIELE (so klingt das Duo - diese Authentizität ist entscheidend):\n\n' +
'Beispiel 1 (Gruppenspiel mit klarem Favoriten):\n' +
'**Delling:** "Nun, Herr Netzer, wir haben hier ja doch einen veritablen Favoriten. Fanden Sie nicht, dass immerhin die Leistungsdaten der letzten Qualifikation für den Außenseiter sprechen könnten?"\n' +
'**Netzer:** "Nein. Das waren Qualifikationsspiele. Das hat mit dem hier nichts zu tun. Das sind fundamentale Dinge."\n' +
'**Delling:** "Seien wir doch mal großzügig - auch der Außenseiter hat Qualitäten."\n' +
'**Netzer:** "Das nennen Sie Qualitäten. Ich nenne das ein Minimalisten-Dasein."\n\n' +
'Beispiel 2 (Ausgeglichenes Spiel):\n' +
'**Delling:** "Herr Netzer, das könnte ja ein enges Spiel werden. Beide Mannschaften liegen dicht beieinander."\n' +
'**Netzer:** "Das war dezent ausgedrückt. Beiden fehlt, was Beckenbauer damals selbstverständlich war - diese Überlegenheit, dieses Selbstverständnis. Aus der Tiefe des Raumes heraus, verstehen Sie?"\n' +
'**Delling:** "Ich glaube, die Spieler würden sich bedanken, wenn Sie ihnen das erläutern könnten."\n' +
'**Netzer:** "Was bleibt mir noch übrig jetzt zu sagen. Ich tippe auf ein 1:1."\n\n' +
'JETZT das echte Spiel:\n' +
'Spiel: **' + homeTeam + '** vs. **' + awayTeam + '** (' + stageLabel + ')\n\n' +
'Schreibe genau 4 Wechselreden (Delling, Netzer, Delling, Netzer). Netzer gibt am Ende seinen konkreten Tipp mit Score. Kein Emoji. Siezen. Kurze Sätze bei Netzer.';
try {
const client = getClient();
@@ -231,7 +259,7 @@ router.post('/insight', async (req: Request, res: Response): Promise<void> => {
const stream = await client.messages.stream({
model: 'claude-haiku-4-5-20251001',
max_tokens: 256,
max_tokens: 512,
messages: [{ role: 'user', content: insightPrompt }],
});
@@ -263,4 +291,116 @@ router.post('/insight', async (req: Request, res: Response): Promise<void> => {
}
});
// ============================================================
// POST /api/agent/insight-audio
// Body: { dialogText: string }
// Gibt eine MP3 zurück (Delling + Netzer als Dialog, 2 Stimmen)
// ============================================================
// ElevenLabs Voice-IDs (kostenlose Standard-Voices)
// Netzer: "Adam" tief, ruhig, autoritär
// Delling: "Antoni" etwas heller, sachlicher
const ELEVENLABS_VOICE_NETZER = process.env.ELEVENLABS_VOICE_NETZER ?? 'pNInz6obpgDQGcFmaJgB'; // Adam
const ELEVENLABS_VOICE_DELLING = process.env.ELEVENLABS_VOICE_DELLING ?? 'ErXwobaYiN019PkySvjV'; // Antoni
async function synthesizeTurn(
text: string,
voiceId: string,
apiKey: string
): Promise<Buffer> {
const res = await fetch(
`https://api.elevenlabs.io/v1/text-to-speech/${voiceId}`,
{
method: 'POST',
headers: {
'xi-api-key': apiKey,
'Content-Type': 'application/json',
Accept: 'audio/mpeg',
},
body: JSON.stringify({
text,
model_id: 'eleven_multilingual_v2',
voice_settings: { stability: 0.55, similarity_boost: 0.75 },
}),
}
);
if (!res.ok) {
const err = await res.text();
throw new Error(`ElevenLabs error ${res.status}: ${err}`);
}
const arrayBuf = await res.arrayBuffer();
return Buffer.from(arrayBuf);
}
// Parst **Delling:** "..." / **Netzer:** "..." Zeilen aus dem Dialog-Text
function parseDialogTurns(
dialogText: string
): Array<{ speaker: 'Delling' | 'Netzer'; text: string }> {
const turns: Array<{ speaker: 'Delling' | 'Netzer'; text: string }> = [];
const lines = dialogText.split('\n');
for (const line of lines) {
const m = line.match(/^\*\*(Delling|Netzer):\*\*\s*[""]?(.+?)[""]?\s*$/);
if (m) {
turns.push({
speaker: m[1] as 'Delling' | 'Netzer',
text: m[2].trim(),
});
}
}
return turns;
}
router.post('/insight-audio', async (req: Request, res: Response): Promise<void> => {
const { dialogText } = req.body as { dialogText?: string };
if (!dialogText) {
res.status(400).json({ error: 'dialogText erforderlich' });
return;
}
const apiKey = process.env.ELEVENLABS_API_KEY;
if (!apiKey) {
res.status(503).json({ error: 'ELEVENLABS_API_KEY nicht konfiguriert' });
return;
}
const turns = parseDialogTurns(dialogText);
if (turns.length === 0) {
res.status(400).json({ error: 'Kein Dialog-Format erkannt' });
return;
}
try {
// Alle Turns parallel synthetisieren
const audioBuffers = await Promise.all(
turns.map((turn) =>
synthesizeTurn(
turn.text,
turn.speaker === 'Netzer' ? ELEVENLABS_VOICE_NETZER : ELEVENLABS_VOICE_DELLING,
apiKey
)
)
);
// MP3-Chunks zusammenführen (einfaches Aneinanderhängen reicht für MP3)
const combined = Buffer.concat(audioBuffers);
res.setHeader('Content-Type', 'audio/mpeg');
res.setHeader('Content-Length', combined.length);
res.setHeader('Cache-Control', 'no-store');
res.send(combined);
logger.info('Agent: Insight-Audio generiert', {
userId: req.staffbaseUser?.sub,
turns: turns.length,
});
} catch (error: unknown) {
const message = error instanceof Error ? error.message : 'Unknown error';
logger.error('Agent: Insight-Audio-Fehler', { error: message });
if (!res.headersSent) {
res.status(500).json({ error: 'Audio-Generierung fehlgeschlagen' });
}
}
});
export default router;