Brand-Mention-KPIs: Welche Metriken bei AEO wirklich zaehlen
Recherche
Q2 2026
Lesezeit
8 Min
Niveau
Praxis
Engines
Multi
Dieser Artikel kann Affiliate-Links enthalten. Wenn du über diese Links einkaufst, erhalten wir möglicherweise eine kleine Provision — ohne Mehrkosten für dich. Das hilft uns, weiterhin kostenlose Inhalte zu erstellen.
Klassisches SEO-Tracking misst Klicks, Rankings und Impressionen — bei Answer Engine Optimization sind das die falschen Hebel. Eine ChatGPT-Konversation produziert weder Impression noch organischen Klick, kann aber zunehmend über B2B-Demo-Requests entscheiden, ohne in klassischen Analytics aufzutauchen. Wer AEO-Performance ernst nehmen will, braucht ein eigenes KPI-Set.
Der Markt für AEO-Tracking-Tools (Profound, Otterly, Brand Radar, AthenaHQ, aeoradar.de, Goodie) ist 2026 aus dem Pilotstadium raus, aber die Metriken-Sprache ist noch nicht standardisiert. Anbieter bezeichnen ähnliche Konzepte mit unterschiedlichen Namen. Dieser Artikel sortiert die sieben relevanten KPIs nach Aussagekraft, zeigt Berechnungslogik und benennt, welche Tools die jeweilige Metrik liefern.
KPI 1: AI Visibility Score (oder Share of AI Voice)
Der zentrale Top-Level-KPI. Misst, in welchem Prozentsatz der getrackten Prompts deine Marke überhaupt erwaehnt wird — unabhaengig davon, ob positiv, neutral oder mit Quellenangabe. Profound nennt das "Visibility Score", Otterly "Mention Rate", aeoradar.de "Share of AI Voice".
Berechnung: (Prompts mit Brand-Mention) / (Gesamte Prompts im Tracking-Set) x 100. Bei 200 getrackten Prompts und 24 Mentions ergibt das 12 Prozent. Im DACH-B2B-SaaS-Kontext liegen typische Werte zwischen 5 und 35 Prozent für mittelgrosse Marken.
Vergleichbarkeit zwischen Tools ist begrenzt, weil das Prompt-Set unterschiedlich ist. Pro Tool ein eigenes Baseline-Trend ueber 30/60/90 Tage ist aussagekraeftiger als ein Cross-Tool-Vergleich am Stichtag.
KPI 2: Citation Rate
Eine Stufe tiefer als Visibility: In wie vielen der Mentions zitiert die AI deine Domain als Quelle? Eine reine Namens-Nennung ohne Link bringt im DACH-Markt etwa 20 Prozent so viel Conversion-Effekt wie eine zitierte Quelle (laut einer eigenen Stichprobe ueber 40 B2B-Funnels, n=40, nicht repraesentativ).
Berechnung: (Prompts mit Domain-Citation) / (Prompts mit Brand-Mention) x 100. Ein gutes Brand-Strength-Signal: Citation Rate ueber 60 Prozent. Unter 25 Prozent deutet auf Content-Discovery-Problem hin — die AI kennt die Marke, findet aber keinen passenden Quell-Artikel.
KPI 3: Sentiment Score
Erwaehnung allein hilft wenig, wenn das LLM dich neben Warnhinweisen platziert. Sentiment-Scoring teilt Mentions in Positiv / Neutral / Negativ. Branch Radar und AthenaHQ liefern das automatisch, Otterly und Goodie nur in Premium-Tiers.
Negative Mentions sind im B2B-Bereich selten (unter 5 Prozent typisch), im E-Commerce haeufiger (Liefer-Issues, Produktfehler). Die wichtigste Frage: Was schreibt die AI ueber Konkurrenten in Verbindung mit unserer Marke? Vergleichs-Mentions wie "X ist guenstiger als Y" sind tonal neutral, aber Conversion-relevant.
Vergleichstabelle: KPIs nach Tool-Verfuegbarkeit
| KPI | Profound | Otterly | Brand Radar | AthenaHQ | aeoradar.de | Goodie |
|---|---|---|---|---|---|---|
| Visibility Score | Ja | Ja | Ja | Ja | Ja | Ja |
| Citation Rate | Ja | Ja | Ja | Ja | Ja | Teilweise |
| Sentiment | Premium | Premium | Ja | Ja | Premium | Premium |
| SoV vs Kompetenz | Ja | Ja | Ja | Ja | Ja | Manuell |
| Prompt-Cohort | Ja | Teilweise | Ja | Ja | Ja | Nein |
| DACH-Sprachfokus | Nein | Teilweise | Nein | Nein | Ja | Teilweise |
KPI 4: Share of Voice gegen Kompetenz
Visibility allein ist kontextlos. Bei einem Prompt wie "Beste CRM-Tools für KMU im DACH-Raum" interessieren weniger absolute Erwaehnungen — sondern wie oft du im Vergleich zu HubSpot, Pipedrive, Salesforce auftauchst. Share of AI Voice misst genau das.
Berechnung: (Eigene Mentions) / (Eigene + Kompetenz-Mentions im selben Prompt-Set) x 100. Ein Newcomer mit 8 Prozent SoV im Schatten von Marktfuehrern ist oft in besserer Lage als ein etablierter Player mit 35 Prozent in einem stagnierenden Markt. Trend > Absolutwert.
KPI 5: Prompt-Cohort-Performance
Welche Prompt-Kategorien performen, welche nicht? Eine technische B2B-Marke kann bei "How does X work" stark zitiert sein, bei "Best X tools" aber komplett abwesend. Die zweite Cohort ist Conversion-relevanter — informational Prompts fuehren selten direkt zur Demo.
Tools wie AthenaHQ und Brand Radar gruppieren Prompts automatisch nach Intent (informational, commercial, comparison). Aus diesen Cohorten lassen sich konkrete Content-Lueckenanalysen ableiten: Wenn du in 5 von 5 "Best X" Prompts fehlst, aber in 4 von 5 "How does X work", weisst du, dass dir Listicle-Content fehlt.
KPI 6: Engine-Coverage
ChatGPT, Perplexity, Gemini, Claude, Copilot, You.com — jede AI hat eigene Retrieval-Logik. Eine Marke kann in ChatGPT-Plus stark performen und in Perplexity unsichtbar sein. Engine-Coverage gibt die Visibility pro Engine als separate Zahl.
Berechnung pro Engine, dann gewichtet nach Engine-Marktanteil. Stand 2026 in DACH (eigene Schaetzung, basierend auf Statista und SimilarWeb-Daten): ChatGPT ~62%, Perplexity ~12%, Gemini ~14%, Claude ~7%, Copilot ~3%, Sonstige ~2%. Eine starke ChatGPT-Position ist daher wichtiger als eine starke Copilot-Position, sollte aber nicht zu Tunnelblick fuehren.
KPI 7: Mention-zu-Conversion-Pfad
Der schwerste KPI, weil er Cross-Tool-Tracking voraussetzt. Auf der Mainseite ein UTM-Parameter wie ?utm_source=chatgpt auswerten, Cross-Reference mit AEO-Tool-Daten, Conversion-Rate ableiten. Dafuer brauchst du saubere Server-Side-Analytics oder PostHog/Mixpanel mit Custom Properties.
Realitaet 2026: Die meisten LLM-Antworten geben Domains als Plain-Text-Link aus ohne UTM. Hilfsweise: Direct-Traffic-Spikes nach Tagen mit AI-Coverage-Steigerungen plotten. Korrelation > Kausalitaet, aber besser als nichts.
Reporting-Rhythmus und Dashboard-Aufbau
Wochen-Snapshot für das Team, Monats-Dashboard für C-Level. Pro Quartal eine deep-dive Analyse mit Cohort-Breakdown und Konkurrenz-Benchmark. Ein 3-Card-Dashboard auf Notion oder Linear reicht: AI Visibility Score (mit 30-Tage-Trend), Citation Rate, Share of Voice vs Top-3-Konkurrenten.
- Wochen-Pulse: Visibility Score, Anzahl neuer Mentions, Sentiment-Delta
- Monats-Report: Cohort-Performance, Engine-Coverage, SoV vs Kompetenz, Top 5 neue Quellen die zitiert wurden
- Quartals-Deepdive: Content-Lueckenanalyse, Conversion-Pfad, Investment-ROI
Haeufige Fragen zu AEO-KPIs
Wie oft sollte ich Prompts neu samplen?
Mindestens woechentlich. AI-Antworten variieren je nach Modell-Version, Temperature-Setting und Retrieval-Caching. Ein Prompt-Set, das nur monatlich getestet wird, verpasst kurzlebige Algorithmus-Aenderungen.
Brauche ich eine Baseline vor Optimierung?
Ja, mindestens 30 Tage Tracking ohne Aenderungen. Ohne Baseline laesst sich kein KPI-Lift nachweisen — und C-Level fragt zurecht nach dem Vorher-Nachher.
Was ist ein realistischer Visibility-Score-Lift in 6 Monaten?
Bei aktivem AEO-Programm (Schema-Markup, FAQ-Pages, Citation-faehiger Content) sind 5-15 Prozentpunkte realistisch. Wer mit 12 Prozent startet, kann auf 22-27 Prozent kommen. Sprung ueber 30 Prozentpunkte in 6 Monaten ist unwahrscheinlich ohne Brand-Building-Massnahmen ausserhalb von AEO.
Wie viel Budget braucht das Tracking?
Tools liegen bei 99-1.200 Euro pro Monat. Für ein KMU mit 100-200 getrackten Prompts reicht ein Einstiegs-Tier bei ~200 Euro. Enterprise mit 2.000+ Prompts und Multi-Engine-Tracking landet bei 800-1.200 Euro.
Veröffentlicht durch die AEO Guide-Redaktion. Veröffentlicht am 24. Juni 2026.
Verantwortlich i.S.d. § 18 MStV: siehe Impressum.
Fehler entdeckt oder ergänzende Erfahrung? korrektur@aeoguide.de
AEO-Briefing wöchentlich
Schema-Templates, Tool-Reviews und Case-Studies — einmal pro Woche, kein Buzzword-Salat.
🎁 Gratis dazu: Schema-Templates für AEO (PDF)