Die Mozilla-Stiftung hat eine frei zugängliche Sprachdatenbank (Common Voice) und ein quelloffenes Programm zur Spracherkennung (DeepSpeech-Engine) veröffentlicht. Beides darf jedermann für eigene Dienste zur Spracherkennung und -steuerung nutzen oder weiterentwickeln.
Positiv unter Datenschutzaspekten: Die Mozilla-Entwicklungen funktionieren auch ohne ständige Internetverbindung.
Die aus dem Common-Voice-Projekt resultierende Sprachsammlung enthält derzeit rund 400.000 Aufnahmen von 200.000 unterschiedlichen Menschen, was ungefähr 500 Stunden an Sprachaufnahmen entspricht - und wächst weiter. Es handelt sich nach Angaben von Mozilla um den zweitgrößten offenen Sprachdatensatz nach dem LibriSpeech-Projekt.
Momentan laufen die Mozilla-Sprachprojekte nur auf Englisch
Nutzer können via iPhone-App und Browser weiter zum Anwachsen der Common-Voice-Datenbank beitragen, indem sie Sätze vorlesen, die dann aufgezeichnet werden - in der Hoffnung, dass daraus datenschutzfreundliche Dienste rund um die Spracherkennung und Sprachsteuerung erwachsen. Aktuell laufen die Projekte nur auf Englisch, andere Sprachen sollen den Angaben zufolge aber schon bald unterstützt werden.
Mozilla selbst gibt an, darüber nachzudenken, Sprachschnittstellen auf Basis von Common Voice und DeepSpeech in vielen Mozilla-Produkten einzusetzen, darunter auch im Firefox-Browser. dpa/tmn
Lesen Sie auch:
Sprachassistenten für daheim: Was sie können - und was nicht
Amazons Alexa: Einkaufen per Sprache von Anfang an aktiviert
Samsung schickt Bixby 2.0 gegen Alexa und Co. ins Rennen
Google zeigt neue vernetzte Lautsprecher