DEEN

Gute-Nacht-Geschichten von Siri? Apple-Hörbücher mit KI-Stimmen

Zuletzt aktualisiert: 12. Januar 2023
12. Januar 2023 | Fabian Oppel
S

ei es zum Entspannen und Einschlafen, beim Autofahren oder Einkaufen: Ein wachsender Teil der hiesigen Bevölkerung konsumiert inzwischen Audiomedien. Während Musikstreaming bei ihnen am beliebtesten ist, hören immerhin 20 Prozent aller Deutschen zwischen 14 und 29 Jahren mindestens wöchentlich auch Hörbücher und Hörspiele. Das ist ein Ergebnis der ARD/ZDF-Onlinestudie 2022, für deren Erstellung wir geforscht haben. Dem wachsenden Bedarf nach Audio steht aber eine aufwändige Produktion gegenüber. Nicht für jedes Buch rentiert sich eine Hörfassung. Apple geht deshalb einen neuen Weg: Für den englischsprachigen Markt sucht der Tech-Konzern nun Bücher, die nicht mehr von echten Menschen vorgelesen werden sollen, sondern von digitalen Stimmen.

COMPUTERGENERIERTE HÖRBÜCHER BEI APPLE BOOKS

Wegen der aufwändigen Produktion sind gerade weniger bekannte Werke häufig nicht in einer Audiofassung verfügbar. Dem möchte Apple nun entgegenwirken: Unter dem Slogan „Jedes Buch verdient es, gehört zu werden“ soll eine künstliche Intelligenz Texte zu Hörbüchern vertonen. Diese Entwicklung fügt sich wunderbar in Apples Reihe von Innovationen ein.

Kernergebnisse der ARD/ZDF-Onlinestudie 2022
Grafik erstellt von GIM im Auftrag der ARD/ZDF-Forschungskommission.

Übrigens: 20% der 14- bis 29-Jährigen hört mindestens wöchtentlich Hörbücher und -spiele. Nähere Infos zu den Ergebnissen der ARD/ZDF-Onlinestudie 2022 findet ihr in unserem Blogpost. Jetzt mehr erfahren!

Mit dem Sprachassistenten Siri ist dem Unternehmen bereits 2011 ein Coup im Bereich der künstlichen Stimm- und Sprachverarbeitung gelungen. Sprachausgabe ist für Apple also nichts Neues – Hörbücher künstlich zu erzeugen, ist eine konsequente Entwicklung. Interessant sind nun für Apple vorerst unabhängige Schriftsteller:innen und Kleinverlage, die nicht in der Lage sind, Hörbücher zu produzieren. Hierzu wartet das kalifornische Tech-Unternehmen aktuell auf Vorschläge für unabhängig veröffentlichte Werke aus der digitalen Apple Books-Bibliothek. Autor:innen oder Verlage können sich bei Apple mit passenden Büchern melden, um sie dann von der KI vertonen zu lassen.

KI LIEST VORERST NUR ENGLISCHSPRACHIGE ROMANE

Vier Stimmen, die von Fachleuten aus verschiedenen Professionen für das jeweilige Genre optimiert worden seien, hat Apple bisher vorgestellt: Eine männliche und weibliche für romantische Romane sowie wiederum eine männliche und weibliche Stimme für Sachbücher über Selbstentwicklung. Die aktuell nur Englisch sprechenden Stimmen könnt Ihr Euch auf einer Seite von Apple anhören.

Bisher werden Hörbücher meist von Menschen gelesen. Apple Books möchte nun erstmals im größeren Stil Hörbücher anbieten, die eine KI-Stimme vertont. Bild: F.J. Jimenez.

Vorerst wird Apple nur englischsprachige Belletristik digital vorlesen, deutschsprachige Bücher sind also noch nicht abzusehen. Für die Vertonung sucht Apple historische und Frauenromane. Dagegen noch nicht möglich seien Thriller, Sciencefiction und Fantasy. Außerdem erwähnt Apple diverse weitere Kriterien, die das Buch erfüllen müsse: So soll der Text einfach strukturiert sein und darf keine komplexen Formatierungselemente beinhalten. Welche Bücher tatsächlich zu hören sein werden, entscheidet sich dann aber nach einer redaktionellen Entscheidung. Im Lauf des Projekts soll das Programm ausgeweitet werden, sodass später mehr Texte in die engere Auswahl gelangen können.

MEIN FAZIT: NICHT ALLES KANN KI LESEN – BISHER!

Ich selbst höre gern Hörbücher – bisher von Menschen gesprochen. Dabei schätze ich besonders die Performance guter Sprecher:innen und deren Interpretation der erzählten Geschichte. Aber ich nutze auch immer wieder automatisierte Sprachausgabe, zum Beispiel wenn ich mir eigene Texte in Word von der Computerstimme vorlesen lasse: So finde ich oft Fehler im Text, die nicht rot unterkringelt werden.

Ich finde, die Apple-Stimmen sind gut – sogar wesentlich besser als die von Word, auch wesentlich besser als die Google-Stimme auf Android-Smartphones. Und ich kenne tatsächlich jemanden, der sich E-Books auf dem Android-Telefon von dieser Stimme vorlesen lässt. Es gibt also sicher Konsument:innen, die auf die KI-generierten Hörbücher zurückgreifen würden. Apple füllt damit einen Need Gap.

Als Beispiel eine Hörprobe aus einem meiner Lieblingshörbüchern: “Die 13 ½ Leben des Käpt’n Blaubär”, gelesen – oder viel eher: grandios performt – vom verstorbenen Schauspieler Dirk Bach. Keine KI könnte das erschaffen!

Aber: Ich höre in den kurzen Probe-Sequenzen, die Apple zur Verfügung stellt, eindeutig, dass ein Computer die Stimme generiert hat. Die Aussagesätze fangen alle auf derselben Tonlage an und hören auf dieser wieder auf, Fragen werden am Satzende überdeutlich in die Höhe gezogen. Insbesondere die Stimmen für Sachbücher finde ich noch sehr kantig und unmenschlich.

Klar, nicht für jeden Text braucht es menschliche Sprecher:innen. Aber gerade dort, wo es einen Menschen braucht – in meinen Augen gerade bei literarischen Texten – ist die KI-Stimme kein Ersatz. Jedenfalls bisher. Einen Hörgenuss für Belletristik kann ich mir unter den aktuellen Bedingungen nicht vorstellen. Aber das ist sicher auch eine Frage, welche Ansprüche die Konsument:innen an Hörbücher stellen.

Headerbild: Jared Craig

Eintagsfliege oder Alternative: Threads versus Twitter ("X")

Mehr erfahren

Mit KI noch nachhaltiger investieren?

Mehr erfahren

Klassiker Relaunched! Nokia 6310 neu aufgelegt

Mehr erfahren

Das war’s dann also! Ende der öffentlichen Telefone

Mehr erfahren

Smartphones: Geht das auch nachhaltig und fair?

Mehr erfahren

Jetzt unseren Newsletter abonnieren

Jetzt unseren Newsletter abonnieren und keine Forschungsthemen, Branchentrends und GIM-Themen verpassen!