Erste Demoanwendungen online
simple speech enabled navigation
The first application demonstrates a simple speech enabled web-navigation. Navigating through the page structure with the help of your voice is quite easy. Every hyperlink, whether internal or external, can be selected by saying “show [page name]“ or “go to [page name]”.
If you want to return to start page, please say: “go back to start page” or “go to start page” or “show start page”.
If you want to go back to main category, please say: “go back to [category name]” or “go to [category name]” or “show [category name]”.
Die erste Anwendung zeigt eine einfache sprachgestützte Navigation. Mit Hilfe von Sprachkommandos durch die Seitenstruktur zu navigieren ist recht einfach. Jeder interne und externe Link kann mit dem Befehl “show [page name]“ oder “go to [page name]” aufgerufen werden werden.
Um auf die Startseite zurückzukehren, sind die Anweisungen “go back to start page” oder “go to start page” oder “show start page” auszusprechen.
Die Rückkehr zur Hauptkategorie ist mit den Befehlen “go back to [category name]” oder “go to [category name]” oder “show [category name]” möglich.
speech enabled google map
Do you know the capital of Alabama, North Carolina, Mississippi or Texas? If not, simply ask for it. The related cities are going to be marked directly on map by system. The voice command for that is: "What is the capital of [Alabama | North Carolina | Mississippi | Texas]?"
Doch wie heißt gleich nochmal die Hauptstadt von Alabama, North Carolina, Mississippi oder Texas? Ihr kennt Sie nicht ? Kein Problem, fragt einfach nach. Die jeweiligen Städte werden dann von unserem System auf der Karte eingetragen. Der Sprachbefehl hierfür lautet: "What is the capital of [Alabama | North Carolina | Mississippi | Texas]?"
Die nächste Generation von Usability:
Webseiten mit integrierter Sprachsteuerung
Ist es möglich, eine Webseite mit Hilfe der menschlichen Stimme zu bedienen? Wenn ja, welche Vorteile ergeben sich daraus für den Nutzer und welche Soft-/ Hardware braucht man hierfür? Auf diese und andere Fragen möchte ich versuchen, eine Antwort zu geben und Euch eine im World Wide Web bis dato einzigartige wie faszinierende Lösung vorstellen.
Was benötige ich hierfür? Voice Pro, Dragon Naturally Speaking...?
Der Clou: Nichts dergleichen! Für die Anwendungen wird keine zusätzliche Spracherkennungssoftware benötigt. Ein funktionstüchtiges Mikrofon und das Flash-Plugin des entsprechenden Browsers reichen bereits vollkommen aus, um auf verbalem Weg mit einer Webseite zu kommunizieren.
Vorteile der Sprachsteuerung
- Barrierefreiheit (accessibility)
Verbale Ein‐ und Ausgaben stellen ein sinnvolles Hilfsmittel dar, um Barrieren im Umgang mit Webseiten abzubauen. Die Weboberfläche kann auch ohne die klassischen Eingabemedien Maus und Tastatur, allein mit Hilfe von Sprache, bedient werden. Diese Tatsache erlaubt es zum einen, Informationen und Interaktionen auch körperlich eingeschränkten Nutzern zugänglich zu machen. Zum anderen können Informationen der Webseite auch von Geräten aus, die weder über Maus/Tastatur noch Monitor verfügen, dem Benutzer vermittelt werden.
- Benutzerfreundlichkeit (usability)
Dem User wird nicht nur ein alternatives Eingabemedium zur Verfügung gestellt, sondern dieses ermöglicht Ihm zugleich auch eine effizientere Bedienung der Seite oder Anwendung. Gerade bei Webseiten mit komplexen Seitenstrukturen und Inhalten können Sprachein- und Ausgaben ein wichtiges Hilfsmittle darstellen, die Dialogführung zu vereinfachen.
- Intuitive Bedienkonzepte
Ein Aspekt, der eng mit der Benutzerfreundlichkeit verknüpft ist, ist die Intuitivität einer Seite oder Anwendung. Gedanken in die Tat umzusetzen (einen Mausklick auszulösen oder eine Tastatureingabe zu tätigen) ist oftmals nicht so einfach, wie man es auf den ersten Blick vermuten könnte. Experten sprechen hierbei von der kognitiven Belastung eines Users. Mit Hilfe von Sprachein- und ausgaben ist es möglich, neue Formen von Bedienkonzepten zu entwickeln, die diese kognitive Belastung reduzieren.
Ein Beispiel soll dies verdeutlichen: In einem Newsportal mit unzähligen Nachrichtenkategorien und Unterkategorien sollen die Fußballergebnisse vom letzten Wochenende aus Spanien angezeigt werden. Der herkömmliche Handlungsstrang eines Users würde nun wie folgt aussehen:
Welche Kategorie ist die richtige? -> Sport -> Suchen und Klicken -> Welche Sportart suche ich? -> Fußball -> Suchen und Klicken -> Was konkret suche ich? -> Spanische Liga->Suchen und Klicken -> Ergebnisse anzeigen -> Suchen und Klicken
Wie wäre es stattdessen mit einer einfachen Spracheingabe: "Zeige die letzen Fußballergebnisse der spanischen Liga"?
- Innovation
Zwar gibt es heute bereits einige Möglichkeiten, Webseiten mit Hilfe von Sprache zu bedienen, alle Lösungen haben allerdings folgende negative Aspekte gemein: Es wird (ausgenommen die serienmäßige Opera Sprachsteuerung und Windowsspracherkennung) eine zusätzliche Spracherkennungssoftware benötigt, die auf dem Rechner des Users zu installieren ist. Um diese problemlos und mit einer hohen Erkennungsgenauigkeit verwenden zu können, ist in der Regel zunächst ein Sprachtraining erforderlich, das die sprachlichen Eigenheiten eines Users (Dialekt, Sprechgeschwindigkeit etc.) in einem Benutzerprofil zusammenfasst.
Sind diese Vorbereitungen erfolgreich abgeschlossen, wird der eigentliche Unterschied deutlich: Die Webseite lässt sich zweifelsohne mit Hilfe von Sprachkommandos mehr oder weniger komfortabel bedienen, diese Sprachbefehle greifen allerdings nicht in die Logik der Webseite ein, sondern sind vielmehr als ein direkter Ersatz der Maus auf der angezeigten Benutzeroberfläche zu betrachten. Eine erweiterte Dialogführung, wie sie im Beispiel der Anzeige der spanischen Fußballergebnisse angedeutet wurde, ist somit nicht möglich. Dies ist nach derzeitigem Stand einzigartig im Web.
Kann Spuren von Innovation enthalten

