Spracheingabe und die Macht der Bots

Es war noch in den 90ern, zugegebenermaßen Ende der 90er, ich denke, so 1997/'98, als ich meinen ersten digitalen Job bei Microsoft angetreten habe. Die Internetdienste waren damals noch in der eigenen Internetschiene MSN angesiedelt und dementsprechend waren wir in einem eigenen Gebäudebereich untergebracht. Mit uns im Gebäudebereich war noch ein weiteres Unternehmen, Lernout & Hauspie, eine der ersten großen Hype-Unternehmen im Bereich der Spracheingabe.

Bill Gates hatte gerade Spracherkennung zum heiligen Gral erklärt, dementsprechend groß war die Euphorie. In jedem Fall arbeiteten bei L&S fleißig Mitarbeiter mit wissenschaftlichem Hintergrund an der richtigen Erkennung von Sprache und Dialekten. Ich durfte selbst als Proband dabei sein und kann sagen: Es war grauenhaft schlecht was da erkannt wurde. Meine Begeisterung war schnell dahin. Obwohl der spätere Konkurs der Firma weniger mit der Technik als finanziellen Eskapaden zu tun hatte – die Technik war definitiv noch nicht marktreif.

Seit damals bin ich immer wieder abwechselnd euphorisch und frustriert, was das Thema Spracheingabe angeht. Die Euphorie kam meistens mit der Bekanntmachung eines neuen Services und nach den ersten vielversprechenden Versuchen, die Frustration beim Dauereinsatz. Siri versteht mich nicht. Mein Samsung Fernseher schaltet sich wahllos ein. Dragon Dictate – übrigens aus L&S hervor gegangen -erkennt zwar so ungefähr das, was ich diktiere, aber am Ende hat es keinen Mehrwert gegenüber einem an der Tastatur verfassten Text. Das Korrigieren dauert einfach zu lange.

Denn noch gebe ich nicht auf, euphorisch zu sein und ich habe die Hoffnung, dass möglicherweise eine der vier Entwicklungen, das Thema Konversation und dabei insbesondere die Audioeingabe als neues Nutzerinterface mehr valide machen:

Entwicklung 1: Wettbewerb. Bisher hatte ich das Gefühl, Audio ist in den Experimentalabteilungen der großen Internetkonzerne untergebracht. F&A ist wichtig und oftmals rein zufällig die Quelle der großen neuen Innovationen, doch die schnellen Fortschritte vor allem dann erzielt, wenn ein Thema in den Mittelpunkt des Interesses rückt. Und genau das ist jetzt der Fall. Amazon hat mit ihrer Alexa-Serie eine ganze Hardwarefamilie nur für das Thema Sprachsteuerung herausgebracht. Cortana und Siri werden immer prominenter in die wichtigsten Betriebssysteme Windows und MacOS eingebaut. Gleiches gilt für die noch wichtigeren Betriebssysteme auf den Mobilgeräten, nämlich iOS und Android. Viele große Unternehmen prügeln sich plötzlich um die Vorherrschaft im Bereich Sprache.

Entwicklung 2: Positive Nutzererlebnisse. Was der Konsument da jetzt on Top bekommt ist ganz schön spannend. Alexa besticht durch ein sehr gutes Verständnis von Sprache, auch aus weiter Entfernung. Die speziell dafür entwickelte Hardware zeigt ihre Wirkung und erhöht tatsächlich signifikant die Erkennungsquote. In die Mobilgeräte sind nun endlich die Chips flächendeckend verbaut, die eine Spracheingabe ohne vorheriges Einschalten des Geräts ermöglichen. Was dann nach dieser Spracheingabe geliefert wird, ist zwar immer noch teilweise unbefriedigend, aber die Integration der Chips zeigt, dass die Unternehmen hier Ernst machen und das Thema wichtiger wird.

Entwicklung 3:Artifizielle Intelligenz. Es sieht so aus als haben die Hardwarehersteller und Softwarefirmen eine neue starke Waffe zur Verbesserung der Erkennungsqualität ausgemacht, die Personalisierung. Alexa, Cortana und Google personalisieren sich auf den jeweiligen Nutzer. Dabei wir zurückgemeldet was nicht erkannt wird oder schlecht war. Gerade Google hat erst kürzlich einen massiven Ansprung der Erkennungsqualität durch diese Verfahren verkündet. Dabei spielt das gerade das viel diskutierte Machine Learning oder die künstliche Intelligenz eine große Rolle, denn um Millionen und später Milliarden von Nutzern eine Personalisierung zukommen zu lassen ist es erforderlich, dass Algorithmen diese Erkennung vorantreiben, Muster erkennen und entsprechend reagieren.

Entwicklung 4: Conversational Interfaces. Facebook, die überraschenderweise noch nicht vollständig auf den Sprachzug aufgestiegen sind und sich aktuell eher auf Video konzentrieren, schieben das Thema Konversation indirekt mit ihrem Messenger an. Der Messenger soll dafür genutzt werden, dass Unternehmen nicht mehr nur Apps zur Verfügung stellen, um in Kontakt zu den Nutzern zu treten, sondern dies über die Messenger App in Form von Konversationen erfolgt. Der Erfolg von WeChat im asiatischen Bereich ist hier das Vorbild. Ich selbst habe es schon probiert und konnte bisher jedoch nur einen geringen Mehrwert erkennen. Die WeChat-Zahlen sprechen aber für sich und das Wichtigste dabei ist, dass ein Prozess in Gang kommt. Die Unternehmen machen sich nun Gedanken, wie solche Vorgänge systematisch in Konversationen automatisiert abgebildet werden können. Wenn die Unternehmen ihre typischen Konversationen aufzeigen, ist es nur noch ein kleiner Schritt bis die Übersetzung der Sprachinformationen dazu verwendet werden kann, entsprechende Informationen zurückzuliefern. Je mehr Unternehmen also ihre Bots erstellen, umso eher sind Alexa, Cortana, Siri und Co in der Lage, sinnvolle Antworten nicht nur durch den Aufruf von Websites, sondern durch verbale Antworten zu liefern.

Wir haben noch einen langen Weg vor uns bis Audio sich wirklich durchsetzt. Wie so häufig wird es aber eine Menge an Early Adopters geben, die die Services nutzen und eine Präferenz dafür aufbauen.

Welche Relevanz hat das für uns als Marketers?

Auch wenn wir es nicht gerne hören, wie fast alle anderen Themen der digitalen Transformation, hat auch dies eine hohe Bedeutung für uns und wird von uns verlangen, dass wir uns mit dem Thema beschäftigen. So wie es für Unternehmen ein Wettbewerbsnachteil geworden ist, wenn sie nicht vernünftig mobil erreichbar sind, so wird das Gleiche im Bereich Sprache und Konversationen auf Sie zukommen. Es werden erst einmal die großen Firmen sein, die hier ihre wirtschaftliche Macht ausspielen. Am Ende des Tages wird es aber auch für Sie relevant, denn die Spracherkennungssoftware wird mit wachsender Treffergenauigkeit zu einem neuen Interface und damit auch zu einem neuen Intermediär zwischen Konsument und Unternehmen. Wer das Thema negiert läuft Gefahr, dass andere Anbieter auf den Plattformen zuerst vorhanden sind und damit die Nutzer entsprechend abgreifen.

Was gilt es also zu tun?

  • Beschäftigen Sie sich damit. Klären Sie, wie zukünftig wichtige und typische Anfragen an Ihr Unternehmen sowie essenzielle Marketingprozesse in Form von Konversationen automatisiert abgebildet werden können. Dies gilt sowohl für Sprache als auch für Chats. In vielen Unternehmen hapert es hier noch an der Systematisierung.
  • Eine Hausaufgabe ist dann, die Dienste auch zu nutzen. Versuchen Sie zu verstehen, was denn da genau passiert, um im nächsten Schritt damit zu experimentieren. Dies ersetzt keine vernünftige Marktforschung, verstehen Sie mich hier nicht falsch. Ihnen wird aber relativ schnell klar, ob und wenn ja, in welchem Umfang hier ein realer Business-Nutzen entsteht.
  • Und dann gilt es, wie so oft, zu testen. Wer die Möglichkeit zu frühen Beta-Zugängen oder ähnlichem hat, sollte diese Chance ergreifen, um zu sehen, was daraus entsteht.

Ich bin überzeugt, dass Sprache in den nächsten Jahren signifikant an Bedeutung gewinnen und sich zu eigener Plattform aufschwingen wird. Kein Unternehmen, das aktiv agieren und Prozesse mitbestimmen möchte, wird es sich erlauben können, nicht präsent zu sein. Wie gesagt, klar werden die großen Player in diesem Spiel vorne sein. Doch Sie können sicherstellen, dass diese die Nachfrage nicht alleine kanalisieren. Seien Sie also auf der Hut und machen Sie Ihre Hausaufgaben im Bereich Konversationen mit Ihren Konsumenten.

Prof. Dr. Jürgen Seitz

ist Professor für Marketing, Medien und die Digitale Wirtschaft an der Hochschule der Medien in Stuttgart (www.hdm-stuttgart.de). Davor war er Geschäftsführer und Gründer der United Internet Dialog GmbH, einer Performance- und Digitalmarketing Firma der United Internet Gruppe. Darüber hinaus verantwortete er das Produktmanagement der United Internet Media AG und war maßgeblich am Wachstum zum marktführenden Vermarkter in Deutschland beteiligt.

Mehr