... und Sprache wird zu Text

Themenseiten

... und Sprache wird zu Text konvertiert online ausschließlich die deutsche Sprache in Text. Diktieren Sie Ihre Notizen, Briefe oder Artikel in Echtzeit und lassen Sie sie automatisch transkribieren*.

* Transkription ist die Verschriftlichung von gesprochener Sprache. Dabei wird der Inhalt einer Audioaufnahme auch in Echtzeit in Textform festgehalten.

Das Programm funktioniert vorerst nur mit

Google Chrome und

Microsoft Edge.

Mit der Spracherkennung beschäftige ich mich schon ein paar Jahre und denke mittlerweile so weit gekommen zu sein, mein Projekt zu veröffentlichen. Sehen Sie es als Versuch, das Schreiben von Texten einfacher zu machen, wenn auch noch lange nicht ausgereift, aber der erste Schritt ist hiermit getan.

Unter Verwendung von Javascript und den "Browsereigenen Diensten" von Google Chrome und Microsoft Edge, entstand "... und Sprache wird zu Text". Diese Dienste sind zur Zeit nicht im Firefox implementiert und mit dem Opera-Browser klappt es auch noch nicht. Andere Browser: bitte selbst testen.

Um in deutschen Texten die Großschreibung von Substantiven zu optimieren, habe ich in einer "JSON-Datei" mit rund 1,2 Million Substantiven auch für medizinsche und technische Worte gesorgt. Diese Datei befindet sich ebenfalls auf meinem Server und wird bereits beim Start des Skriptes geladen. Eine grüne Progress-Bar zeigt das Laden an - das dauert, je nach Ihrer Internetanbindung zwische 2 bis 10 Seknden.

Wer sich für das Thema "Spracherkennung" (SpeechRecognition) interessiert, kann bei https://webaudio.github.io/web-speech-api/ vorbeischauen und es gibt auch eine Seite, die bereits seit einigen Jahren einen ähnlichen Dienst anbietet: speechnotes.co

Mein Script "... und Sprache wird zu Text" nutzt die "Browsereigenen Dienste" bzw. APIs, die im Browser bereits vorhanden sind. "Browsereigene Dienste" sind Funktionen, die direkt in einen Webbrowser integriert sind, um nicht von externen Erweiterungen oder Anwendungen abhängig zu sein.

Die Web Speech API (SpeechRecognition)

Für die Spracherkennung wird die Web Speech API verwendet (window.SpeechRecognition oder window.webkitSpeechRecognition). Diese API ermöglicht das Umwandeln von gesprochener Sprache in Text direkt im Browser.

Die Web Audio API wird für die Audioaufnahme und die Visualisierung des Peakmeters genutzt (AudioContext, AnalyserNode, MediaStreamAudioSourceNode). Damit wird das Mikrofon-Signal analysiert und der Lautstärkepegel grafisch dargestellt.

MediaDevices.getUserMedia().

Zum Zugriff auf das Mikrofon wird die navigator.mediaDevices.getUserMedia({ audio: true }) API verwendet.

Diese API fordert von Ihnen die Erlaubnis an, das Mikrofon für "... und Sprache wird zu Text" verwenden zu dürfen.

Für das Kopieren des Textes (der Button unter dem Textfeld, zum kopieren des erzeugten Textes) in die Zwischenablage wird die moderne Clipboard API (navigator.clipboard.writeText()) verwendet.

Diese Dienste laufen komplett im Browser und benötigen keine externen Server, außer dass die Spracherkennung intern vom Browser (z.B. Google Chrome oder Microsoft Edge) über deren eigene Server laufen kann. Das ist aber browserintern und nicht explizit im Code sichtbar.

Erstellt 02.07.2025

Revision 00 vom 02.07.2025 - Seitenerstellung und Freigabe