Stimme+
Voicebots
Zur Merkliste Lesezeichen setzen

Heidelberger KI klont Stimmen für Bahn, ADAC und Air France

   | 
Lesezeit  3 Min
audio Anhören
Erfolgreich kopiert!

Ein paar eingesprochene Sätze genügen – und eine Stimme spricht plötzlich mehrere Sprachen. Das Unternehmen Aristech zeigt, wie aus Sprachtechnologie ein internationales Geschäftsmodell wird.

Durch den Fortschritt in Künstlicher Intelligenz (KI) und Spracherkennung sind Voicebots mittlerweile in der Lage, komplexe Interaktionen menschenähnlich zu führen.
Durch den Fortschritt in Künstlicher Intelligenz (KI) und Spracherkennung sind Voicebots mittlerweile in der Lage, komplexe Interaktionen menschenähnlich zu führen.  Foto: stock.adobe.com

Niederländisch: kein Problem. Türkisch: auch nicht. Alles ist nur einen Mausklick entfernt. Die Stimme unseres Autors spricht an dem Vormittag in Heidelberg im Handumdrehen beinahe jede Sprache der Welt – lediglich auf Grundlage einiger auf Deutsch eingesprochener Sätze. Diese ergeben jeder für sich genommen wenig Sinn: „Da sie auch nicht geschüttelt werden dürfen, ist endlich geklärt, weshalb sich James Bond nie zum biodynamischen Anbau bekannte.“ Aha. Vier, fünf dieser kryptischen Sätze reichen – schon ist die geklonte Stimme auch mehrsprachig einsetzbar, liest im Duktus ihres Besitzers jeden x-beliebigen Text.

„Wir können mit relativ wenig Audio eine Stimme trainieren“, sagt Atilla Azgin. Er arbeitet als Entwickler bei Aristech, einem Unternehmen aus Heidelberg, das sich auf die Fahnen geschrieben hat, Kommunikation einfacher und effizienter zu machen. Dafür entwickelt das Team von Gründerin Carolin Edler-Mende und Vater Michael KI-basierte Sprachtechnologien.

Mit der SWR-Stauhotline fing 2021 die Geschichte von Aristech an

„Klingt nach Türkisch“, beurteilt Atilla Azgin, der türkische Wurzeln hat, das kleine Experiment. Stimmen in ein paar Minuten zu klonen, ist in Zeiten von Künstlicher Intelligenz freilich kein Hexenwerk mehr. Entsprechend sind die Anwendungsfälle von Aristech, das eine eigene Plattform für intelligente Kundenkommunikation entwickelt hat, auch weitaus komplexer. Die Anfänge der Gründer allerdings fallen noch in die KI-Steinzeit.

Seit 2012 arbeiten Carolin Edler-Mende und Vater Michael Mende an der Schnittstelle zwischen Menschen und Maschine. „Unsere Vision war, sich mit Maschinen besser unterhalten zu können, als es damals der Fall war“, sagt die Gründerin und Geschäftsführerin. Das klassische Text-to-Speech, bei dem eine Maschine einen vorgegebenen Text spricht, gab es natürlich zu dieser Zeit schon. Die Aristech-Gründer dachten aber: Das muss doch besser und schöner gehen. Ihr erstes Projekt war die SWR-Stauhotline, die früher tatsächlich von Menschen besprochen wurde.

An alles österreichischen Bahnhöfen läuft die Durchsage aus dem Haus Aristech

„Wir haben dafür eine Stimme entwickelt, die heute noch genutzt wird“, erklärt Edler-Mende mit Stolz. Es war der Einstieg ins Geschäft mit Passagier-Durchsagen: Aristech gewann danach eine Ausschreibung der Österreichischen Bundesbahnen (ÖBB), die Durchsagen in Zügen und an Bahnsteigen künftig digitalisieren wollten. Die Sprecherin, die das 35 Jahre lang gemacht hatte, stand kurz vor dem Ruhestand, erzählt Edler-Mende. Aristech machte möglich, dass die gewohnte Stimme die Ansagen trotz Ruhestand auch heute noch übernimmt.

Zwei Wochen lang haben die Tech-Experten die Frau im Studio Ansagen einsprechen lassen und so ihre Stimme mit dem typischen Dialekt perfekt geklont. „Seit 2015 läuft unsere Stimme überall in Österreich“, sagt Edler-Mende. Die Durchsagen können jederzeit problemlos geändert werden, die Stimme bleibt immer dieselbe. Inzwischen hat das weiblich geführte Tech-Unternehmen zudem andere Verkehrsbetriebe mit einer digitalen Stimme ausgestattet.

Die Heidelberger erwarten 2026 vier Millionen Umsatz – und könnten skalieren

Die automatisierten Durchsagen bei den Stuttgarter Straßenbahnen stammen aus dem Hause Aristech, auch die Ansagen der Freiburger Verkehrs AG. Ihre Tech-to-Speech-Expertise haben die Heidelberger auch bei den Kölner Verkehrsbetrieben eingebracht, bei denen nun die geklonte Stimme einer bekannten Radiomoderatorin die Durchsagen macht.

Carolin Edler-Mende und ihr Vater Michael Mende haben Aristech 2012 gegründet, inzwischen umfasst das Team 30 Mitarbeiter.
Carolin Edler-Mende und ihr Vater Michael Mende haben Aristech 2012 gegründet, inzwischen umfasst das Team 30 Mitarbeiter.  Foto: Aristech

Mit den Aufträgen ist auch das Unternehmen gewachsen. „Mit dem Auftrag der ÖBB haben wir damals unseren ersten Mitarbeiter eingestellt“, sagt Edler-Mende. Inzwischen ist ihr Team auf 30 Personen angewachsen, dem Start-up-Alter sei man längst entwachsen. Für 2026 ist ein Umsatz von vier Millionen Euro prognostiziert. „Wir wollten langsam und nachhaltig wachsen“, sagt die Chefin, die ohne Investoren gestartet ist. Allerdings erlebe der Markt gerade eine „krasse Dynamik“, so dass auch Aristech jetzt überlegen muss, schneller zu wachsen. „Wir könnten skalieren“, sagt die Geschäftsführerin.

„Unsere Vision war, sich mit Maschinen besser unterhalten zu können, als es damals der Fall war.“

Carolin Edler-Mende

Mit seinen Technologien für automatisierte Kommunikation im Kundenservice in Unternehmen und öffentlichen Institutionen sind die Heidelberger ein relevanter Marktteilnehmer. Gerade erst hat die Fluggesellschaft Air France verkündet, ihren Kundenservice mit einem mehrsprachigen KI-gestützten Voicebot von Aristech auszubauen. Der Sprachassistent nimmt Anrufe bereits jetzt auf Deutsch, Englisch, Französisch und Niederländisch entgegen, kann offen gestellte Fragen beantworten und sogar Flüge umbuchen.

Aristech bietet den kompletten Technologie-Stack selber an

„Mit dem Projekt zeigen wir, dass KI-gestützter Kundenservice auch in hochkomplexen, internationalen Umgebungen zuverlässig, skalierbar und datenschutzkonform funktioniert“, sagt Edler-Mende. In Deutschland hat das Unternehmen den Kundenservice des ADAC neu aufgestellt. „Vom Verlust der Mitgliedskarte bis zum Abschleppservice kann das System alles alleine regeln“, sagt Michael Mende. Erst wenn es komplexer wird, kommt ein menschlicher Servicemitarbeiter ins Spiel.

Dass es dabei um hochsensible Daten geht, ist den Heidelbergern bewusst – sie machen daraus eine Stärke: „Die Cloud-Infrastruktur wird in Deutschland gehostet, wir haben hier die komplette Datenhoheit“, sagt Edler-Mende. Den kompletten Technologie-Stack selbst anbieten zu können, werde immer wichtiger. Und weniger souveräne Lösungen kommen für die Heidelberger nicht infrage. Dass ihre KI scheinbar spielerisch zwischen Sprachen wechselt, wirkt da fast beiläufig – und ist doch Ausdruck eines klaren strategischen Anspruchs.

Hinter dem Namen Aristech versteckt sich nichts weiter. „Das ist historisch gewachsen und hat keine tiefere Bedeutung“, sagt Gründer Michael Mende. Es habe zwischendurch auch Überlegungen für eine Umbenennung gegeben  allerdings war die Marke schon zu bekannt. Das hätte sich womöglich negativ ausgewirkt.     

Kommentare öffnen
Nach oben  Nach oben