Alternativ als Spracherkennung bezeichnet, ist die Spracherkennung ein Computersoftwareprogramm oder ein Hardwaregerät mit der Fähigkeit, die menschliche Stimme zu dekodieren. Die Spracherkennung wird häufig verwendet, um ein Gerät zu bedienen, Befehle auszuführen oder zu schreiben, ohne eine Tastatur oder Maus verwenden oder irgendwelche Tasten drücken zu müssen. Heute geschieht dies auf einem Computer mit ASR-Softwareprogrammen (automatische Spracherkennung). Viele ASR-Programme erfordern, dass der Benutzer das ASR-Programm “trainiert”, um seine Stimme zu erkennen, damit es die Sprache genauer in Text umwandeln kann. Sie könnten zum Beispiel „Öffne Internet“ sagen und der Computer würde den Internetbrowser öffnen.
Das erste ASR-Gerät wurde 1952 verwendet und erkannte einzelne Ziffern, die von einem Benutzer gesprochen wurden (es war nicht computergesteuert). Heutzutage werden ASR-Programme in vielen Industrien verwendet, einschließlich Gesundheitswesen, Militär (z. B. F-16-Kampfflugzeuge), Telekommunikation und Personal Computing (dh Freihand-Computing).
Wenn Sie die Spracherkennung verwenden, um Aktionen auf Ihrem Computer zu steuern oder für Sie zu tippen, handelt es sich um eine Eingabeart, die als Spracheingabe bezeichnet wird.
Was braucht die Spracherkennung?
Damit die Spracherkennung funktioniert, benötigen Sie einen Computer mit einer Soundkarte und entweder einem Mikrofon oder einem Headset. Bei anderen Geräten wie Smartphones ist die gesamte erforderliche Hardware im Gerät integriert. Außerdem benötigt die von Ihnen verwendete Software Spracherkennungsunterstützung, oder wenn Sie die Spracherkennung überall verwenden möchten, müssen Sie ein Programm wie Nuance Naturally Speaking installieren.
Wenn Sie Microsoft Windows Vista, 7, 8 oder 10 verwenden, können Sie auch das mitgelieferte Windows-Spracherkennungsprogramm verwenden.
Obwohl die Spracherkennung mit jedem Mikrofon durchgeführt werden kann, erzielen Sie viel bessere Ergebnisse, wenn Sie ein Headset verwenden.
Beispiele dafür, wo Sie möglicherweise die Spracherkennung verwendet haben
Da sich die Spracherkennung verbessert, wird sie an immer mehr Orten implementiert und es ist sehr wahrscheinlich, dass Sie sie bereits verwendet haben. Nachfolgend finden Sie Beispiele dafür, wo Sie möglicherweise auf die Spracherkennung stoßen.
-
Automatisierte Telefonsysteme – Viele Unternehmen verwenden heute Telefonsysteme, die den Anrufer an die richtige Abteilung weiterleiten. Wenn Sie jemals so etwas wie „Sagen Sie oder drücken Sie Nummer 2 für Support“ gefragt haben und Sie „Zwei“ sagen, haben Sie die Spracherkennung verwendet.
-
Google Voice – Google Voice ist ein Dienst, mit dem Sie auf Ihrem Computer, Tablet und Telefon suchen und Fragen stellen können.
-
Digitaler Assistent – ​​Amazon Echo, Apples Siri und Google Assistant verwenden Spracherkennung, um mit digitalen Assistenten zu interagieren, die bei der Beantwortung von Fragen helfen.
-
Auto-Bluetooth – Bei Autos mit Bluetooth- oder Freisprech-Telefonkopplung können Sie die Spracherkennung verwenden, um Befehle wie „Ruf meine Frau an“ zu tätigen, um Anrufe zu tätigen, ohne den Blick von der Straße zu nehmen.
Arten von Spracherkennungssystemen
Die automatische Spracherkennung ist ein Beispiel für die Spracherkennung. Nachfolgend finden Sie weitere Beispiele für Spracherkennungssysteme.
-
Sprecherabhängiges System – Die Spracherkennung erfordert Training, bevor sie verwendet werden kann, was erfordert, dass Sie eine Reihe von Wörtern und Sätzen lesen.
-
Sprecherunabhängiges System – Die Spracherkennungssoftware erkennt die Stimmen der meisten Benutzer ohne Training.
-
Diskrete Spracherkennung – Der Benutzer muss zwischen jedem Wort eine Pause einlegen, damit die Spracherkennung jedes einzelne Wort identifizieren kann.
-
Kontinuierliche Spracherkennung – Die Spracherkennung kann eine normale Sprechgeschwindigkeit verstehen.
-
Natürliche Sprache – Die Spracherkennung kann nicht nur die Stimme verstehen, sondern auch Antworten auf Fragen oder andere Fragen geben, die gestellt werden.
AVR, Biometrie, Freisprechen, Mausraster, Phonem, Bildschirmleser, Tonbegriffe, Sprachsynthese, Sprache, VoIP