IVR-Menüs: So wird Ihr Telefon-Support schneller und smarter

6 Min
Markus Mayr
Markus MayrSolutions Consultant

Das gesprochene Wort spielt im Kundenkontakt eine zentrale Rolle. Damit die Kommunikation im telefonischen Kundenservice einfacher, schneller und effizienter wird, lohnt sich der Einsatz moderner Sprachdialogsysteme. In diesem Blogartikel zeigen wir, wie Sie mit Sprachdialogsystemen Zeit sparen, Prozesse optimieren und die Kundenzufriedenheit steigern können.


Sprachdialogsysteme – auch als IVR (Interactive Voice Response) bekannt – sind intelligenten Lösungen und längst mehr als nur klassische Sprachauswahlmenüs. Durch die automatische Umwandlung von Text in Sprache (Text-to-Speech) und Sprache in Text (Speech-to-Text) können sie Informationen im Telefonsupport vollautomatisch erfassen und weiterverarbeiten.

Doch wie genau funktioniert das eigentlich?

Was ist ein Sprachdialogsystem (IVR) und wie funktioniert es?

„Wenn Sie Fragen zum Produkt haben, drücken Sie die <1> . Haben Sie Fragen zur Rechnung, drücken Sie <2>.“

Wir alle machen regelmäßig unsere Erfahrungen mit dem IVR (Interactive Voice Response)-System einer Telefon-Hotline: Die Anruferinnen und Anrufer können per Tastendruck auf der Telefontastatur (DTMF) oder durch Nachsprechen bestimmter Wörter ihr Anliegen selbst eingrenzen bzw. vorqualifizieren. Entsprechend ihrer Auswahl werden sie automatisch zum richtigen Ansprechpartner oder zur gewünschten Abteilung weitergeleitet.

Mittels natürlicher Sprache ist dieser Wahlvorgang noch einfacher möglich. Die Anrufer:innen nennen etwa frei ihr Anliegen oder die Abteilung, mit der sie verbunden werden wollen. Eine ausgereifte Spracherkennungs-Software erkennt das Gesprochene und verarbeitet diese Informationen weiter.

Grafik Funktionsweise IVR Sprachdialogsystem

Technisch wird bei Sprachdialoglösungen zwischen Text-to-Speech (TTS) und Speech-to-Text (STT) bzw. Automatic Speech Recognition (ASR) unterschieden.

Das bedeutet: Interactive Voice Response-Systeme sind bidirektional anwendbar. Einerseits können Sie geschriebenen Text in Sprache ausgeben lassen, oder Gesprochenes in einen Text transkribieren. Beide Varianten kommen in der modernen, cloudbasierten Telefonie zur Anwendung.

Doch der Einsatzbereich von Sprachdialogsystemen ist damit noch lange nicht zu Ende!

Verwechseln Sie Sprachdialogsysteme nicht mit Sprachassistenten wie Siri, Alexa & Co.! Sprachassistenten sind Software-Systeme, welche die Abfrage von Informationen in natürlicher Sprache ermöglichen, Dialoge führen und Assistenzdienste erbringen. Im Gegensatz dazu ist der Aufgabenbereich von Sprachdialogsystemen auf eine bestimmte Funktion beschränkt, z.B. Bestellannahme, Datenbankabfragen, Rufweiterleitungen und so weiter.

Bleiben Sie informiert!

Jetzt zum Newsletter anmelden und regelmäßig News & Tipps erhalten.

So profitiert Ihr Unternehmen von einem Sprachdialogsystem

  • Standardisierte und oft wiederkehrende Serviceprozesse lassen sich einfach abbilden – Sie sparen im Kundenservice Zeit und Geld!

  • Eingehende Anrufe werden effizient gesteuert – ein Muss, um hohe Anrufaufkommen zu bewältigen!

  • Ihre Mitarbeiterinnen und Mitarbeiter werden durch die Automatisierung entlastet.

  • Sie können Ihre Telefon-Hotline mit individuellen Begrüßungen und Telefonansagen aufwerten.

  • Ihr Telefon-Support wird schneller und zielgerichteter – Ihre Kundinnen und Kunden werden gleich mit dem richtigen Ansprechpartner verbunden. Die verkürzte Wartezeit erhöht die Kundenzufriedenheit und stärkt die Kundenbindung.

  • Bestimmte Anliegen, wie etwa Bestellungen oder Beschwerden, sowie ausgewählte Kundengruppen – etwa Gold-, Silber-, VIP-Kunden – können priorisiert behandelt werden.

  • Mitarbeiter:innen, Standorte und Dienstleister:innen können durch die Vorauswahl nach Themen/Anliegen spezialisierter eingesetzt werden – das erhöht die Kompetenz und reduziert den Schulungsaufwand.

  • IVR-Informationen können in Ihre CRM-Software übertragen werden – Sie lernen Ihre Kund:innen besser kennen!

  • Durch Abfrage einer bestimmten Kundeninformation (z.B. Kundennummer) kann am Bildschirm Ihrer Callcenter-Agents sofort der richtige Kundendatensatz geöffnet werden.

  • Mittels Online-Statistiken lernen Sie mehr über das Anrufverhalten und können Ihre telefonischen Services stetig optimieren! Die Anrufabläufe lassen sich über Online-Statistik-Tools wie den yuuline Manager von yuutel einfach per Klick anpassen.

So spart eine Sprachdialoglösung Zeit und Ressourcen im Support

Praxisbeispiel:
Bei einem yuutel Kunden konnten von 1.000 eingehenden Anrufen mehr als 40 % vollständig durch eine automatisierte Sprachdialoglösung bearbeitet werden – ganz ohne Einsatz eines Agents und ohne Rückfragen. Diese automatisierten Anrufe dauerten im Schnitt nur eine Minute. Die restlichen 60 % der Gespräche erforderten eine persönliche Beratung mit einer durchschnittlichen Dauer von 7 Minuten 15 Sekunden. Insgesamt ergab sich so eine beeindruckende Zeitersparnis von rund 2.500 Minuten.

Doch das ist nicht alles: Bereits die Vorqualifizierung durch das Sprachdialogsystem verkürzte die Gesprächsdauer zusätzlich – um etwa 15 %. Vor der Einführung dauerte ein beratendes Gespräch durchschnittlich über 8 Minuten 30 Sekunden.

Ein weiterer Vorteil: Die frei gewordene Zeit konnte für andere Aufgaben genutzt werden – ein klarer Effizienzgewinn für das gesamte Contact Center.

Grafik Zeitersparnis mit IVR Sprachdialogsystem

Natürlich können diese Werte je nach Aufbau der Sprachdialoglösung, der Komplexität der Anfragen und dem Anteil automatisierter Abläufe variieren. Das Beispiel zeigt jedoch eindrucksvoll, welches Potenzial in einer durchdachten Automatisierung steckt – und wie viel effizienter Ihr telefonischer Kundensupport dadurch werden kann.

Werfen wir nun einen Blick auf die beiden Schlüsseltechnologien moderner Sprachdialogsysteme: Text-to-Speech und Speech-to-Text.

Was ist Text-to-Speech?

Unter Sprachsynthese (Text-to-Speech) versteht man jene Technologie, die aus einem geschriebenen Text eine menschlich klingende Sprachausgabe erzeugt. Der Anwender gibt dazu einen geschriebenen Text ein und die TTS-Engine erzeugt eine akustische Sprachausgabe, die jener einer menschlichen Sprachmelodie möglichst nahe kommt. Oder anders gesagt: Die Software liest den Text vor („Vorlese-Automat“).

Die Text-to-Speech-Technologie ist ein echter „Game Changer“ für mehr Effizienz im Kundensupport! Im telefonischen Kundenservice werden oft die immer gleichen Fragen gestellt – und Mitarbeiter:innen müssen immer wieder dieselbe Antwort „wiederkäuen“. Mithilfe eines Sprachdialogsystems (IVR) können Sie solche Anfragen automatisiert beantworten, indem diese Informationen von einer TTS-Engine wiedergegeben werden.

Die zweite Variante des Sprachdialogsystems – Speech-to-Text (Spracherkennung) – funktioniert in die andere Richtung: Gesprochene Worte werden in geschriebenen Text transkribiert.

So setzen Sie Text-to-Speech intelligent ein:

  • Ihr Unternehmen ist mit wiederkehrenden Fragen konfrontiert, die immer gleich beantwortet werden

  • Sie möchten Kund:innen oder Partner:innen barrierefrei informieren (z.B. Textausgabe statt SMS-Versand)

  • Ihr Unternehmen muss Produktrückrufe durchführen und verzeichnet viele Anrufe zum gleichen Thema

  • Sie müssen Ihre Kund:innen rasch über geänderte Produktinformationen informieren

  • Sie möchten flexibel Telefonansagen ändern, ohne jedes Mal einen professionellen Sprecher bzw. Sprecherin dafür zu beauftragen

Best Practice: „Vorlese-Automat“ für Blaulichtorganisationen
Ein yuutel Kunde nutzt Text-to-Speech, um automatisiert Einsatzdetails an die zuständigen Blaulichtorganisationen durchzugeben. Der Vorteil: Die Notfallstellen bekommen den Info-Text einfach vorgelesen und werden rasch und zuverlässig informiert – etwa, an welchem Autobahnkilometer sich ein Unfall ereignet hat.

Was ist Speech-to-Text?

Für die meisten Anrufer:innen ist es längst Routine, per Tastendruck in die gewünschte Abteilung weitergeleitet zu werden.

Anders sieht es aus, wenn im IVR-Menü nach einer mehrstelligen Kunden-, Buchungs- oder Paketnummer gefragt wird. Diese über die Telefontastatur einzugeben, kann schnell stressig werden – vor allem, wenn nur wenige Sekunden Zeit bleiben und die Eingabe beim ersten Versuch sitzen muss.

Mit Speech-to-Text können Anrufer:innen solche Informationen einfach per Sprache übermitteln. Die Spracherkennungssoftware erfasst das Gesagte, wandelt es in Text um und stellt die Daten dem System für den weiteren Call-Flow zur Verfügung.

Das Ergebnis: eine deutlich dynamischere und nutzerfreundlichere Menüführung im Vergleich zu statischen DTMF-Menüs.

Keine Sorge: Während Spracherkennungssysteme vor einigen Jahren noch für skurrile Ergebnisse sorgten, hat sich die Technologie inzwischen rasant weiterentwickelt – und arbeitet heute äußerst zuverlässig.

Best Practice: Automatisierte Anfragebeantwortung für ein Reiseportal

Zu Beginn der Corona-Krise verzeichneten Unternehmen der Reisebranche ein stark erhöhtes Anrufaufkommen. Ein Online-Reiseportal setzte daher Speech-to-Text ein, um Kund:innen trotz der hohen Nachfrage bestmöglich zu betreuen:

Nach der Sprachauswahl <Umbuchung> oder <Stornierung> wurden Anrufer:innen gebeten, den Reiseveranstalter zu nennen, bei dem sie gebucht hatten. Der ausgesprochene Firmenname wurde vom System erkannt, und anschließend gab das System mithilfe von Text-to-Speech die jeweils aktuellen Informationen des entsprechenden Veranstalters aus.

So setzen Sie Speech-to-Text intelligent ein:

  • Transkription eines telefonischen Beratungsgesprächs

  • Transkription einer Anrufbeantworter-Aufsprache

  • Erfassung und Verarbeitung eines speziellen Kundenwunsches

  • Gezielte Information zu einem speziellen Produkt

  • Verarbeitung von Kundendaten

Expertentipps für die Automatisierung Ihres Sprachwahlmenüs

Unternehmen, die ein IVR-Menü mit Sprachsteuerung einsetzen, profitieren von zufriedeneren Anrufer:innen und einem effizienteren Support. Damit das gelingt, ist eine nutzerfreundliche Gestaltung entscheidend:

  • 1. Halten Sie IVR-Menüs kurz und kompakt!

    Zu viele Auswahl-Optionen und verschachtelte Ebenen verwirren Ihre Anrufer:innen und führen oft zum Gesprächsabbruch. Vier bis fünf Optionen sind das Maximum! Achten Sie auch auf kurze, präzise Bezeichnungen – Ihre Anrufer:innen können die Sprachausgabe schließlich nicht unterbrechen.

  • 2. Seien Sie eindeutig!

    Nur wenn Ihren Anrufer:innen klar ist, was mit den einzelnen Punkten im Sprachwahlmenü gemeint ist, können sie eine zielführende Auswahl treffen. Verwenden Sie also eindeutige Keywords und Kategorien und lassen Sie diese eventuell durch Test-Anrufe bestätigen.

  • 3. Überfordern Sie Ihre Anrufer:innen nicht!

    Setzen Sie Text-to-Speech und Speech-to-Text bewusst ein. Bedenken Sie auch, dass Menschen das Gehörte erst verarbeiten müssen – geben Sie Ihren Kund:innen also im Auswahlmenü die nötige Zeit, um etwas zu sagen.

  • 4. Achten Sie auf die Aktualität Ihrer Sprachdialog-Menüs!

    Auch die Informationen aus einem Text-to-Speech-System sind nur so gut, wie sie aktuell sind. Bei yuutel können Sie Ihre Ansagen und Routings rasch und unkompliziert im yuuline Manager anpassen.

  • 5. Integrieren Sie Umgangssprache und regionale Dialekte! 

    Der Spracherkennungs-Software in IVR-Systemen fällt es oft schwer, umgangssprachliche Begriffe oder Dialekt zu verstehen. Helfen Sie dem System daher beim Lernen und erweitern Sie laufend die Datenbank um Dialektausdrücke oder Begriffe, die von den Anrufer:innen häufig falsch gebraucht werden.

Fazit: Mehr als nur Rufweiterleitungen!

IVR-Menüs und Sprachdialogsysteme bieten enormes Potenzial für Ihren telefonischen Kundenservice. Mit Text-to-Speech lassen sich wiederkehrende Anfragen vollautomatisch beantworten – Ihre Mitarbeiter:innen gewinnen dadurch Zeit für komplexere Aufgaben. Umgekehrt sorgt Speech-to-Text dafür, dass Anrufer:innen schneller zur richtigen Ansprechperson gelangen oder ihre Anliegen automatisch erfasst werden.

Das Ergebnis: Ihre Kund:innen erhalten rascher die gewünschten Informationen, Ihr Support-Team arbeitet effizienter – eine klare Win-win-Situation, die Zeit, Ressourcen und Kosten spart.