Hanseatisch. Praktisch. Blog.

„Hallo Computer“ – Mit Computern sprechen

Nicht nur StarTrek-Fans kennen es: Das Reden mit dem Computer, ihm Kommandos geben. Aber in der Serie funktioniert es.
Etwas, was so ohne weiteres mit dem normalen PC nicht klappt.

Ohne weiteres nicht. Aber es gibt Programme dafür. Die mehr oder weniger gut funktionieren.
Natürlich braucht man auch ein am Rechner angeschlossenes Mikrofon dafür.

Funktioniert es wirklich?

Ja.
Allerdings unterschiedlich gut. Abhängig vom Mikrofon und der verwendeten Software, und auch der eigenen Sprechweise.

Eigen ist allen Programmen das diese genau eingerichtet werden wollen. Und das dauert ein wenig.
Dabei ist nicht die Installation das Problem. Die Software muss den Sprecher kennen lernen. Zum einen gibt es normalerweise nach dem ersten Start eine Einrichtungsphase. Da wird dann getestet ob das Mikrofon richtig eingerichtet ist, und ob die Software die Signale auch gut verarbeiten kann. Also ob das Mikrofon zu sehr rauscht und ob der Abstand zum Mund richtig ist um alles richtig gut aufzuzeichnen.

Und danach kommt dann der schwierige Part: Das Anlernen.

Die Software muss sich an eure Tonlage und Sprechweise anpassen. Das menschliche Gehirn ist so leistungsfähig die Sprechweise von vielen verschiedenen Menschen richtig zu interpretieren. Aber auch das menschliche Gehirn wird angelernt. Das fängt bereits im Kleinkind-Alter an.
Die Software muss auch lernen euch richtig zu verstehen und dafür sind dann normalerweise einige Texte vorzulesen. Anhand dieser stellt sich die Software auf euch ein.

Eines sollte einem dabei aber klar sein. Perfekt wird sie nicht. Gerade am Anfang macht sie, trotz der Anfangs-Lernphase, noch einige Fehler. Je nach Software mehr oder weniger. Aber sie lernen alle während der Benutzung dazu. Wenn ein Wort falsch erkannt wurde, kann man dies in der Software direkt korrigieren. Und dabei lernt die Software.
So wird die Spracherkennung mit der Zeit immer besser. Und ist gerade für Menschen die nicht sehr schnell tippen können eine unheimliche Zeitersparnis.
Aber auch für Menschen die schnell tippen können, oder gar Maschinenschreiben gelernt haben, kann die Spracherkennung einen Vorteil bringen. Nicht nur die Zeit ist ein Faktor, es ist auch einfach bequemer.

Eines ist aber klar. Ein ruhiger Hintergrund macht es der Software leichter den Text zu erkennen.

Bisher habe ich zwei verschiedene Spracherkennungsprogramme genutzt:

Windows Spracherkennung

Windows hat seit Vista eine eingebaute Spracherkennung. Jedenfalls in einigen Versionen.
Finden tut man dies Programm dann im „Zubehör“-Ordner.

Die Spracherkennung von Windows 7 soll noch einmal deutlich verbessert worden sein, gegenüber der Version von Vista.
Und meinem Test der Vista Spracherkennung nach ist dies auch mehr als nur nötig. In Windows Vista hatte ich dies Programm ausgiebig trainiert und an meine Sprache angelernt.

Leider war das Ergebnis katastrophal. Es ist klar das eine Spracherkennungssoftware wie oben beschrieben am Anfang noch lernt und Fehler macht. Aber ich habe tatsächlich 15 Minuten für einen Satz gebraucht. Also 15 Minuten für das Diktat und die Korrektur. Danach ist man eher bereit Amok zu laufen als die Software noch für einen zweiten Satz zu benutzen.
Wenn dies in Windows 7 jetzt verbessert wurde ist diese vielleicht endlich nutzbar. Wer Sie hat kann sie ja gerne einmal testen. Sollte es damit dann aber nicht wirklich gut laufen, dem kann ich die nachfolgende Software empfehlen:

Dragon NaturallySpeaking

Dragon NaturallySpeaking (auch oft DNS genannt) ist eine kostenpflichtige Software für Windows-Systeme. Jetzt erscheint gerade die neue Version 11 von Dragon NaturallySpeaking.

Nach dem eher als Katastrophe zu bezeichnenden Versuch mit der Windows-Spracherkennung hatte ich mir Dragon NaturallySpeaking besorgt und getestet.
Nach der Einführungs- und Einlernphase den ersten Satz diktiert, und ich war überrascht. Zwar war da auch ein Fehler drin, aber es ging schnell. Und war deutlich genauer.
Da machte es Spaß noch weiter zu diktieren. Und zu sehen wie der Computer das Diktat in Schrift umwandelte.

Mittlerweile ist meine Version schon gut angelernt. Sie macht bei normalen Wörtern nur noch sehr selten mal einen kleinen Fehler. Aber auch diese sind in dieser Spracherkennung einfach schnell berichtigt.

Theoretisch kann man mit Dragon NaturallySpeaking, sowie mit der Windows Spracherkennung, auch den PC in Maßen steuern. Aber da ist mir die Maus bzw. mein Trackball doch lieber.
Für das Schreiben von Texten, unter anderem diesen hier, liebe ich die Spracherkennung aber.

Dragon NaturallySpeaking kommt in der neuesten Version in mehreren Varianten daher. Den kleinsten Funktionsumfang hat „Dragon NaturallySpeaking Home 11„*. Aber bereits diese Version kommt mit einem Headset. Meinen Erfahrungen mit dem Headset der Version 10 nach ist dies aber nicht sehr komfortabel zu tragen, und billig hergestellt.
Dragon NaturllySpeaking Premium 11„* bietet schon ein paar Funktionen mehr. Ob man diese benötigt muss jeder selber wissen. Für Privatleute reicht sicher die Home-Variante. Auf der Webseite des Herstellers kann man sich dann einen Überblick verschaffen ob die Version ausreicht.
Gerade für Menschen die das geschäftlich nutzen gibt es aber noch erweiterte Versionen. So ist in der Mobile-Variante* der Premium Edition bereits ein Diktiergerät enthalten. Denn Dragon NaturallySpeaking kann auch Dateien die mit einem Diktiergerät aufgenommen wurden umwandeln. Zumindest wenn diese im richtigen Format vorliegen.

Für manch einen noch interessant ist das „Dragon Naturally Speaking Premium 11 Wireless„*. Dies kommt mit einem Funk-Headset. Kein Kabel mehr was stört, und was einen zu extrem eng an den PC bindet. 😉

Für Anwälte und Menschen aus dem Medizinsektor gibt es extra Versionen. Diese haben teilweise nötige Zertifizierungen aber auf jeden Fall einen fachlich erweiterten Sprachschatz.

Alles in allem macht es Spaß Texte dem PC zu diktieren, und nicht mehr zu tippen. Und gerade Dragon NaturallySpeaking kann ich wirklich empfehlen. In meinem Bekanntenkreis wurde damit sogar ein Buch geschrieben… bzw. diktiert. Es ist also wirklich leistungsfähig.

Und für Mac-User gibt es vom selben Hersteller die Spracherkennung macspeech*.

Das könnte dir auch gefallen
1 Kommentar
  1. euroduplication@pressen lassen (URL entfernt) sagt

    sehr gute Darstellung und Übersicht.

    Ich habe vor 4 Jahren wirklich versucht mit diesen Dingen zu arbeiten. Fazit: ungenügend.

    Ich glauber werde einen neuen Versuch starten.

    Danke aus Pressungen

Hinterlasse eine Antwort

Deine Email-Adresse wird nicht veröffentlicht.