Home
Das simon Handbuch
Contents
1. Abbrechen One P Two o Three Four Five Cancel wi Plug Ins verwalten gt Neues Kommando C Bearbeiten L schen Verbunden aber Deaktiviert Modellsynchronisation 0 A Details Nummer eingeben Mit dem Nummer eingeben Plug In kann der Benutzer leicht Nummern beliebiger Gr e eingeben Mit dem Diktations oder Text Makro Plug In k nnte man eigentlich leicht Nummern Ihren Ziffern zuweisen und das als Eingabemethode verwenden Um h here Nummern einzugeben gibt es dann zwei M glichkeiten jeweils mit entsprechenden Nachteilen Die vollen W rter hinzuf gen Elf Zw lf etc Obwohl das als die eleganteste L sung erscheint weil sie es erm glicht z B f nfhundertzweiundsiebzig zu sagen k nnen wir leicht sehen das es ein enormer Aufwand ware all diese W rter hinzuzuf gen und sie dann auch noch zu trainieren Und wo h ren wir auf e Die Nummern mit Ihren einzelnen Ziffern buchstabieren 83 Chapter 4 simon benutzen Obwohl das nicht ganz so elegant scheint wie die erste L sung ist das nat rlich viel praktikabler Leider erwarten einige Applikationen wie z B das hervorragende mousless browsing firefox addon dass der Benutzer eine Zahl zwar ber die Tastatur ziffernweise eintippt aber dabei nur kurze Pausen zwischen den einzelnen Ziffern macht das mouseless browsing Addon bspw wird per Default max mal 500ms also eine halbe Sekunde zwischen den einzelnen Tastendr c
2. Computer Internet um einen Browser zu ffnen e Computer Mail Um einen Mail Client zu offnen e Computer schlie en Um das aktuelle Fenster zu schlie en Wenn wir der deutschen Grammatik folgen w rde die Grammatik die folgenden Eintr ge beinhalten Table 4 2 Beispiels Vokabular Um die oben definierten S tze zu erlauben w rde wir folgende Grammatik verwenden Nomen Nomen f r S tze wie Computer Internet e Nomen Verb f r S tze wie Computer schlie en Das wirde zwar funktionieren aber wurde auch Kombinationen wie Computer Computer Internet Computer Internet Internet etc erlauben die alle nicht wirklich sinnvoll sind Um die Erkennungsgenauigkeit zu erh hen k nnen wir unsere Grammatik optimieren 51 Chapter 4 simon benutzen Es ist wichtig im Hinterkopf zu halten dass jeder Benutzer mit simon seine eigene Sprache definiert Das bedeutet dass Sie n keiner Weise an die Grammatikregeln der zugrunde liegenden echten Sprache Deutsch Englisch etc gebunden sind F r simple Steuerung des Computers ist es sogar empfehlenswert eigene Grammatikregeln zu erfinden um grammatikalische Unterschiede die f r den Anwendungsfall nicht wichtig sind zu eliminieren und unsinnige S tze zu verbieten In dem Beispiel oben ist es beispielsweise nicht relevant dass schlie en ein Verb ist oder das Computer und Internet Nomen sind Stattdessen k nnen wir sie als etwas deklarieren das besser re
3. Wir wollen also ein System haben dass den Satz Computer Internet erkennt Also geben wir entweder den Text tiber Importiere Text ein oder erstellen eine Textdatei mit dem Inhalt Computer Internet jedes Satzzeichen w rde funktionieren und speichern es als simongrammar txt um die Option Importiere Dateien zu verwenden 54 Willkommen Eingabedaten Imporfiere Fertig S a simongrammartxt KWrite Datei Bearbeiten Ansicht Extras Einstellungen Hilfe 55 Chapter 4 simon benutzen e Vi Grammatikstrukturen Importieren TAREA ks Eingabe Sie Wenn das die folgende Option ausgew hlt wird werden auch S tze Wilkommen importiert die W rter beinhalten dessen Terminal unbekannt ist S tze die Eingabedaten W rter mit mehrdeutigen Terminalen werden trozdem ignoriert Importiere _ Auch unbekannte W rter akzeptieren Fertig __ Importiere Text e Importiere Dateien Kodierung Automatisch v i Dateien zu importien a se Hinzuf gen Entfernen lt Zur ck Weiter gt Abbrechen simon wird dann den eingegebenen Text bzw all die angegebenen Textdateien einlesen in diesem Fall nur die Datei simongrammar txt und jedes einzelne Wort in sowohl dem aktiven als auch dem Schattenlexikon nachschlagen die Definition im aktiven Lexikon hat Vorrang ber eventuelle Definitionen im Schattenlexikon Es wird dann das Wort mit dem
4. D Bitte w hlen Sie Ihre Quellen sorgf ltig und achten Sie darauf nur hochqualitatives Material zu verwenden Iwert e N Ausl ser Schattenw rterbuch W Zur ck Weiter gt Abbrechen Seit Version 0 3 k nnen Sie W rterb cher auch direkt in das aktive Vokabular importieren Diese Option ist haupts chlich n tzlich um es leichter zu machen von selbst entwickelten manuellen L sungen auf simon umzusteigern und um Modelle aus lteren simon Versionen zu importieren z B aus Version 0 2 Sie werden fast nie ein sehr gro es W rterbuch in das aktive Vokabular importieren wollen S e finden eine Liste verf gbarer W rterb cher die mit simon getestet wurden auf dem simon Wiki http www cyber byte at wiki index php Deutsch Schattenw C3 B6rterbuch simon kann derzeit mit f nf verschiedenen W rterbuchformaten umgehen e HADIFIX e HTK e PLS e SPHINX e Julius HADIFIX W rterbuch simon kann HADIFIX W rterb cher importieren Ein Beispiel eines HADIFIX Worterbuches ist das Deutsche HADIFIX BOMP http www sk uni bonn de forschung phonetik sprachsynthese bomp 49 Chapter 4 simon benutzen Hadifix W rterb cher bieten sowohl Terminal als auch Ausspracheinformationen Durch eine spezielle Ausnahme in Ihrer Lizenz ist das Simon Listens Team stolz darauf Ihnen einen direkten Download und Import des ausgezeichneten HADIFIX BOMPs in simon anbieten zu k nnen Importiere W rterbuch a Ve
5. 47 Chapter 4 simon benutzen entfernen aber wird das Wort 1m Schattenvokabular weiterf hren sollte das Schattenlexikon das selbe Wort bereits beinhalten wird es n cht noch einmal eingef gt Alle Aufnahmen Trainingsdaten die das Wort beinhalten bleiben erhalten Um das Wort wieder zu verwenden f gen Sie es wieder zum aktiven Vokabular dazu Wenn Sie ein neues Wort mit dem selben Namen hinzuf gen werden die Werte dieses Wortes vorgeschlagen werden Es gehen also keine Daten unwiederbringlich verloren e L sche das Wort aber behalte assoziierte Aufnahmen Entfernt das Wort komplett aber beh lt Aufnahmen in denen es vorkommt Wenn Sie ein weiteres Wort mit dem selben Namen hinzuf gen werden die Aufnahmen wieder damit assoziiert Seien S e vorsichtig mit dieser Option da das neu hinzugef gte Wort m glicherweise anders transkripiert wird und dieser Unterschied nicht automatisch erkannt und beachtet ewrden kann simon wird dann bei der Modellgenerierung die neue Aussprache auch bei den alten Aufnahmen erwarten W hlen Sie diese Option nicht wenn die Aufnahmen f r das Wort falsch betont waren e Das Wort komplett l schen Entfernt das Wort Alle Aufnahmen die das Wort beinhalten werden ebenfalls entfernt Diese Option l sst keine Spuren von weder dem Wort selbst noch assoziierten Sprachdaten auf dem System zur ck Da Aufnahmen global sind nicht zu einem spezifischen Szenario zugewiesen werden auch Aufnahmen die in Trai
6. szenarios Basiimodelle Server Audioger te Lautst rke Fertig am Wiki Die Konfiguration besteht aus f nf einfachen Schritten die hier aufgezeigt sind Sie k nnen jeden Schritt oder sogar den ganzen Assistenten berspringen In diesem Fall wird das System mit Standardwerten eingerichtet Szenarios In diesem Schritt k nnen Sie Szenarios aus dem Internet herunterladen und direkt in simon importieren 22 simon a ey x Co J r Szenarios Ein Szenario beschreibt genau einen Anwendungsfall der Spracherkennung Sie k nnen beispielsweise simon einrichten Firefox zu steueren einfach indem Sie das entsprechende Firefox Szenario installieren Willkommen Szenarios Basismodelle Server Audioger te W hlen Sie Szenarios laden um Szenarios aus einer Onlinesammlung auszuw hlen Lautst rke Fertig Szenarios laden Zur ck Weiter gt Abbrechen Wenn Sie Szenarios holen dr cken wird der Szenario Downloaddialog angezeigt A W amp simon Installation von Erweiterungen DE VF XBMC Von bedahr This cantent is a GERMAN scenario for simon As such the content is of course German Deutsec 11x heruntergeladen DE VF Firefox Von bedahr This content is a GERMAN scenario for simon As such the content is of course German Deutsc 20x heruntergeladen DE VF Fensterverwaltung Von bedahr This content is a GERMAN scen
7. GPL dv Authors Franz Stieger f stieger cyber byte at SP Hinzuf gen L schen W OK Abbrechen Wenn Sie ein neues Szenario erzeugen geben Sie Ihm bitte einen deskreptiven Namen Um es sp ter auf KDE files http kde files org index php xcontentmode 692 hochzuladen w rden wir Sie bitten das folgende Namensschema zu bernehmen lt Sprache gt lt Basismodell gt lt Name gt Wenn Sie zum Beispiel ein deutsches Szenario erzeugen das mit dem Voxforge Basismodell funktioniert um Mozilla Firefox zu kontrollieren wird das DE VF Firefox Ist Ihr Szenario nicht speziell auf ein Phonemset Basismodell zugeschnitten k nnen Sie den zweiten Tag entfernen DE Firefox Die Szenario Version ist nur eine inkrementelle Nummer die es leichter macht zwischen verschiedenen Versionen des selben Seznarios zu unterscheiden Wenn Ihr Szenario eine spezielle Funktion von simon verwendet zum Beispiel ein neues Plugin k nnen Sie hier die minimal ben tigte simon Versionsnummer angeben Wurde die ben tigte Funktionialit t entfernt l sst sich auch eine maximale Versionsnummer definieren Die Lizenz l sst sich ber das Drop Down Men ausw hlen Sie k nnen auch beliebigen Text in das Eingabefeld eintragen Sie k nnen Ihren Namen oder Alias zu der Liste der Szenarioautoren hinzuf gen Sie werden auch nach einer Kontaktm glichkeit gefragt werden Diese Kontaktm glichkeit kann dazu verwendet werden den Autor ber
8. 34 J d L We UR AN il A KA A y w ON a W u Um diese Funktionalit t zu verwenden geben Sie einfach Ihre Accountdetails in die Soziale Desktop Konfiguration in der simon Konfiguration ein Basismodelle Diese Sektion beschreibt wie Sie Basismodelle mit simon verwenden F r generelle Informationen ber Basismodelle sehen Sie bitte das Hintergrund Kapitel Um simon zu konfigurieren Basismodelle zu verwenden geben S e einfach g ltige Basismodelldateien in simons Konfiguration an Einstellungen gt simon einrichten gt Modelleinstellungen 35 Chapter 4 simon benutzen d Vi Einrichten simon L I el Le x Konfiguration des Sprachmodells ol Allgemein 9 Allgemein Erweiterungen e Modelltyp Aufnahmen Le Statisches Modell _ Adaptiertes Basismodell _ Benutzergeneriertes Modell Sprachmodell V Basismodell el Hilfe Modell z Einstellungen HMM Definitionen hmmdefs bin gz 3 Laden Tiedlist tiedlist H Laden Erkennung Makros macros H Laden Hd Stats stats H Laden Aktionen Social Desktop Hilfe t Voreinstellungen Zur cksetzen W Ok e Anwenden Abbrechen Laden Sie die Dateien mit den entsprechenden Laden Kn pfen neben den Dateien die Sie laden wollen Die Dateien werden zu einem internen Pfad kopiert sodass die Quelle entfernt werden kann nachdem das Basismodell bernommen wurde F r statische Modelle ben tigen Sie weder macros noch stats Dateien aber simon wird d
9. ber die simon Toolbar ausw hlen Wechseln Sie zum Schattenvokabulr indem Sie auf die Registerkarte Schattenvokabular klicken Suchen wir mit der Filter Box ber der Liste nach Feier 42 oe Datei Szenarios Ze vw Verbinden 7 Willkommen Aktives Vokabular Vokabular Wort Entla feier Feier Feierlichkeit Feierlichkeiten fal rlic Feiern feiern Gedenkfeier Wort Hinzuf gen Vokabular A Hundertjahrf Hundertjahrf Pfingstfeiertag pfINstfal _ Pfingstfeiert Nicht Verbunden Erkennung Module Kommandos simon Aktionen Einstellungen Hilfe H E o Grammatik Training Kommandos o Kommandos Wortliste Schattenvokabular Feier Betonung Kategorie gisEntla fal r fal rlic fal rn fal rn g dENk hUnd rt kenen Age pfiNstfal ge Te Wort editieren Synchronisieren a NOM NOM A N hA v i q W rterbuch importieren E3 Leeren amp Wort l schen 7 DE Demo v a Szenarios verwalten W rter trainieren __ S tze generieren lt gt Zum Training hinzuf gen Wort aus Training l schen amp gt Trainiert die ausgew hlten W rter Fertig 200 a Details Wir k nnen sehen dass das Wort Feier mit f al r transkripiert wurde Filtern wir jetzt nach Fox statt Feier und wir sehen dass Fox fO k s ausgesprochen wird Daraus k nnen wir ohne Probleme
10. gbare Sprachmodelle Hier k nnen Sie zu einer lteren Modellversion zur ckkehren Sprachmodell Mi Sep 8 09 17 31 2010 Mi Sep 8 09 34 39 2010 ol ML Sep 8 10 38 01 2010 a Mi Sep 8 18 40 32 2010 Modell Mi Sep 8 22 43 48 2010 Einstellungen Do Sep 9 07 28 19 2010 Do Sep 9 10 33 52 2010 Do Sep 9 14 55 38 2010 i Erkennung A Dy Aktionen CH Social Desktop verf gbare Modelle auflisten Modell ausw hlen Hilfe CG Voreinstellungen Zur cksetzen w OK SS Anwenden Abbrechen Erst nachdem ein Sprachmodell synchronisiert wurde werden alle nderungen angewendet Zus tzlich wird dabei auch ein neuer Wiederherstellungspunkt angelegt Per Default wird simon nach jeder nderung an den Modelldateien eine Synchronisation einleiten um die nderungen zu bernehmen Das nennen wir automatische Synchronisation Die automatische Synchronisation ist die empfohlene Einstellung Wenn Sei jedoch mehr Kontrolle ber die Synchronisation w nschen k nnen Sie simon anweisen vor jeder Synchronisation nachzufragen oder die komplett manuelle Synchronisation ausw hlen bei der simon die Synchronisation nie automatisch einleiten wird stattdessen m ssen Sie den Men punkt Synchronisation verwenden s ehe Sektion das simon Hauptfenster wenn Sie das Sprachmodell synchronisieren wollen Der simond Server wird eine Kopie der letzten f nf Versionen von den Modell Eingabedateien Wortliste Grammatik etc
11. mp3 und ogg Dateien durchsucht wird Alle gefundenen Dateien werden importiert Wenn Trainingsdaten importiert werden werden alle konfigurierten Nachbearbeitungsfilter angewandt 66 Wenn Sie etwas anderes als WAV Dateien importieren sind Sie daf r verantwortlich dass die Dateien w hrend dem Import korrekt dekodiert werden zum Beispiel durch Nachbearbeitungsketten oder die Modellerstellung wird fehlschlagen Kommandos Wenn simon aktiviert ist und es erkennt etwas wird das Erkennungsergebnis den geladenen Kommando Plug Ins der Reihe nach f r die weitere Verarbeitung bergeben A a e simon wis x Datei Szenarios Erkennung Module Kommandos Aktionen Einstellungen Hilfe x E ka d C x DE Demo y Szenarios verwalten Verbinden Wort Hinzuf gen Vokabular Grammatik Training Kommandos ronisiere 7 Willkommen Wortliste Kommandos Computer Mozilla Firefox y 9 Programm Jo Text Makro Tastenk rzel D Konqueror Mozilla Firefox Lj Desktopgitter e Amarok Zahl eingeben S OpenOffice org 3 2 Writ St g p org 3 iter Arbeitsordner LE Liste d KWord Ausf hrbare Datei usr bin firefox Beschreibung Web Browser Kombination Ausl ser z Plug Ins verwalten gt Neues Kommando Bearbeiten L schen Nicht Verbunden Fertig amp Details Das Kommandosystem kann mit einer Gruppe von Fabrikarbeitern verglichen werden Jeder von Ihnen weil wie er genau eine Aufgabe bew
12. rter existieren und welche Kombinationen Satze oder Strukturen existieren Ein Sprachmodell besteht aus zwei Teilen e Sprachmodell language model Beschreibt welche W rter existieren und welche S tze grammatikalisch korrekt sind e Akustikmodell acoustic model Beschreibt wie welche Tone Phoneme klingen Sie ben tigen beide Komponenten um die Erkennung in simon zu aktivieren Sprachmodell In den meisten F llen werden Sie nur die gew nschten Szenarios f r Ihren Anwendungsfall einrichten um ihr Sprachmodell language model zu erstellen Um ihr eigenes Sprachmodell zu bauen k nnen Sie simon verwenden um W rter hinzuzuf gen zu editieren zu l schen und ihre Grammatikstrukturen zu verwalten Um das Hinzuf gen von W rtern leichter zu machen k nnen Sie ein Schattenlexikon importieren Akustikmodell Um ein eigenes Akustikmodell zu erzeugen k nnen Sie einfach die Trainingstexte ein paar mal vorlesen die mit den Szenarios ausgeliefert werden die S e installieren 21 Chapter 4 simon benutzen Wenn Sie thre eigenen Szenarios erstellen k nnen Sie leicht Trainingstexte selbst erstellen Sie k nnen au erdem statische oder adaptierte Sprachmodelle verwenden um die Abhagigkeit des HTKs zu vermeiden oder die Erkennungsrate zu steigern Einrichtungsassistent Beim ersten Start von simon wird eine Anleitung angezeigt die Sie durch die ersten Schritte mit simon simon i g KS S j Wilkommen
13. Drei S Mier FH F nf E Sechs S Sieben S Acht E Neun S Komma ZS Zur ck ae Ok Lei Abbrechen Der Ausl ser definiert welches Wort oder welche Phrase die Oberfl che zum Eingeben der Nummer anzeigen wird Standardm ig verwendet das Nummer eingeben Plug In Nummern um die einzelnen Zahlen auszuw hlen und einige Kontrollworte Um das Nummer eingeben Plug In komplett zu verwenden stellen Sue bitte sicher dass Ihr Sprachmodell folgende S tze erm glicht Null Eins Zwei Drei Vier F nf Sechs Sieben Acht Neun Zur ck Komma 85 i Ok e Abbrechen Chapter 4 simon benutzen Um diese Ausl ser zu konfigurieren ver dern Sie einfach die Kommandos die mit dem Plugin assoziiert sind of A e S amp S Datei Szenarios Erkennung Module Kommandos E c E Grammatik Training Kommandos 4 Ce v Verbinden 7 Willkommen Wort Hinzuf gen Vokabular Wortliste Par Filter Hei LZ Programm Jo Text Makro A Tastenk rzel LI Desktopgitter a Liste Kombination simon Aktionen Einstellungen Bi o Kommandos Si Nummer Hi Null Eins Si Zwei F nf Si Sechs Sieben aii Si aii ai gd ER E Si Plug Ins verwalten Nicht Verbunden Diktation Acht Neun Komma Zur ck e Ok Lei Abbrechen gt Neues Kommando d i DE Demo y o Szenarios verwalten Drei aso Drei Beschr
14. Eingabefeld ein 62 Lokale Textdateien Trainingstext hinzuf gen nn Willkommen Quelle wahlen Neu Importieren Arbeire Fertig simon kann herk mmliche Textdateien importieren um Sie f r das Training zu verwenden Spezialtraining Zus tzlich zu den Trainingstexten erlaubt simon es auch individuelle W rter oder Wortkombinationen aus Ihrem Lexikon direkt zu trainieren Diese Funktion befindet sich im Vokabel Men von simon 63 Chapter 4 simon benutzen Information Aktion Medien Program em ce 6 ESO me ms mu mn Ion Iazen remm GEES ESCHER zen ex ms nm fee genni erung ao Wahlen Sie die W rter zum Trainieren aus dem Vokabular links aus und ziehen Sie sie mit gedr ckter Maustaste zur Liste rechts Sie k nnen das Wort auch in der Tabelle ausw hlen und dann auf Zum Training hinzuf gen klicken Starten S e das Training in dem S e Trainiert die ausgew hlten W rter ausw hlen Das Training selbst ist das gleiche wie bei gespeicherten Trainingstexten 64 Spezialtraining Wilkommen Lautst rke Texte vorlesen Fertig mar OXYGENTIMES Wenn mehr als neun W rter zu trainieren sind wird simon automatisch den Text gleichm ig auf mehr als eine Seite Aufnahme aufteilen Nat rlich k nnen Sie auch W rter aus Ihrem Schattenlexikon zur Liste der zu trainierenden W rter hinzuf gen Bevor das Training dann gestartet we
15. Klee Beete scenario for simon As such the Details installiert content is of course German aie Deutsc RRR K KA 20x heruntergeladen DEF Fensterverwaltung Suchbegriff eingeber von bedahr S Deinstallieren This content is a GERMAN lt n scenario for simon As such the Details content is of course German Bin ihn ale Suchen ae Se Schlie en Wenn Sie ein Szenario erstellen das f r andere simon Anwender von interesse sein k nnte laden Sie es bitte hoch damit es auch anderen simon Anwendern zugute kommen kann Szenario exportieren Szenarios k nnen in eine lokale Datei simons XML Szenariodateiformat exportiert werden und diese 31 Chapter 4 simon benutzen Datei dann in die simon Scenarios http kde files org index php xcontentmode 692 Sektion der OpenDesktop Seite KDE files org http kde files org hochgeladen werden Um auf den OpenDesktop Seiten hochladen zu k nnen ben tigen S e einen Account auf der Seite Die Registration http opendesktop org usermanager new php ist allerdings sehr leicht und nat rlich kostenlos simon erlaubt es Ihnen neue Inhalte direkt von der Benutzeroberfl che heraus hochzuladen Export gt Ver ffentlichen 32 EN VF Mouse control DE VF Firefox DE VF Fensterverwaltung DEF Tastatur DE VF XBMC DEMF Maus EN VF Firefox EN VF Window management ENF Amarok 33 Chapter 4 simon benutzen
16. Kommandos kann der Benutzer Text mit Kommandos assozieren Wenn ein Text Makro Kommando ausgel st wird wird der Text mit dem das Kommando verbunden ist ber simulierte Tastendr cke geschrieben di Le Kommando simon beschreiben simon Name Trigger simon beschreiben ef Typ Jo Text Makro Mm e Beschreibung Nur ein Testtext Verkn pfter text simon ist eine Open Source Spracherkennungsl sung s Ok Abbrechen List Kommandos List Kommandos kombinieren mehrere Kommandos alle Typen von Kommandos werden unterst tzt in eine einzelne Liste Der Benutzer kann dann einen Eintrag der Liste ausw hlen indem er dessen Nummer 1 9 sagt und damit dieses Kommando ausl sen List Kommandos sind sehr hilfreich um die Menge an W rter im Vokabular und damit die Menge der ben tigten Trainingsdaten gering zu halten 73 Chapter 4 simon benutzen Kommando Startmen simon 19 Zeigt eine Liste von Programmen zum starten an List Kommandos sind vor allem dann n tzlich wenn Kommandos schwierig auszusprechende Trigger haben oder mehrere Kommandos logisch gruppiert werden k nnen Ein typisches Beispiel w re ein Kommando Startmen das eine Liste von Programmen Program Kommandos auflistet So k nnen diese Program Kommandos sehr komplexe aber beschreibende Namen besitzen wie z B OpenOffice org Writer 3 1 ohne dass simon diese W rter jemals erkennen muss um das Kommando ausz
17. Text umzuwandeln Um das zu erreichen benutzen sie eine statistische Repr sentation der gesprochenen Sprache Um es einfach auszudr cken Der Computer lernt wie die W rter oder besser gesagt die Laute die die W rter ausmachen klingen Ein Sprachmodell besteht aus zwei Teilen im Deutschen wird leider nicht zwischen Sprache im Sinne von Sprechweise und der Sprache im Sinne von Deutsch Englisch etc unterschieden Deshalb besteht das Sprachmodell speech model aus einem Sprachmodell language model und einem Akustikmodell acoustic model e Sprachmodell e Akustikmodell Sprachmodell Das Sprachmodell definiert das Vokabular und die Grammatik die verwendet wird F r mehr Information sehen Sie bitte die Vokabular Sektion und die Grammatik Sektion Akustikmodell Das Akustikmodell repr sentiert die Aussprache in einem maschinenlesbaren Format Betrachten wir das folgende Beispiels Vokabular Table 2 1 Beispiels Vokabular Int rnEi Die Aussprache jedes Wortes besteht aus einzelnen Lauten die mit Leerzeichen getrennt sind Das Wort schlie en besteht bspw aus den folgenden lauten Ss e 1 e 5 e n Das Akustikmodell nutzt die Tatsache dass gesprochene W rter genauso aus Lauten bestehen wie geschriebene W rter aus Buchstaben bestehen Darauf aufbauend k nnen wir W rter n einzelne Laute zerlegen und sie bei der Erkennung wieder zusammenbauen Diese Bausteine nennt man Phoneme Das Ak
18. aufbehalten Das fertige erstellte Modell wird dabei nicht aufbehalten Wenn Sie eine fr here Version einspielen wird aber das Modell anhand dieser Quelldateien automatisch neu generiert Wahlen Sie dazu wenn Sie mit dem Server verbunden sind einen der verf gbaren Modelle aus und stellen Sie es mit einem Klick auf Modell ausw hlen wieder her Bitte beachten Sie dass die Synchronisation generell nur komplette Quell Modelle akzeptieren wird eine Modellquelle ist komplett wenn Sie eine Wortliste eine Grammatik und ein paar Trainingssamples besitzt sodass nicht komplette Modelle nie auf dem Server gespeichert werden Unvollst dige Quellmodelle obliegen damit auch nicht dem automatischen Backup 106 Aktionen Mit der Aktionskonfiguration kann die Reaktion auf Erkennungsergebnisse konfiguriert werden Erkennung Neben dem wahrscheinlichsten Ergebnis kalkuliert simon die 10 besten Erkennungsergebnisse Jedes Ergebnis wird mit einer Punkteanzahl zwischen 0 und 1 versehen wobei 1 einer Sicherheit von 100 entspricht Mit Hilfe der Minimale Sicherheit k nnen Sie eine minimale Sicherheit f r Erkennungsergebnisse unter dieser Ergebnisse ignoriert werden Wenn mehr als ein Erkennungsergebnis diesen Wert berschreitet wird simon ein Popup anzeigen das die wahrscheinlichsten Ergebnisse anzeigt aus denen dann ausgew hlt werden kann SW A Did you mean 7 w Cal x Command TI 78 Desktopgitter Anzeigen 1 63 Des
19. ausw hlen oder in der Kommandokonfiguration fix setzen 89 Chapter 4 simon benutzen L i R simon lt 3 gt u el amp X EN Se Ergebnis 2 Sp Taschenrechner 3 Se Rechnung amp Ergebnis 4 Pe Formatiertes Ergebnis 5 Pe Formatierte Rechnung amp Ergebnis 6 Be Formatiertes Ergebnis Geld 7 Se Formatierte Rechnung amp Ergebnis Geld Gei Cancel Filter Mit dem Filter Plug In k nnen Sie Erkennungsergebnisse abfangen bevor Sie andere Plug Ins erreichen Mit diesem Plug In k nnen Sie beispielsweise die Erkennung ber die Sprache pausieren Ein Filter hat zwei Zust de e Inaktiv Der Standardzustand Alle Erkennungsergebnisse werden weitergereicht e Aktiv Wenn der Filter aktiviert ist wird der Filter alle Ergebnisse fressen die zu einem konfigurierten String passen Standardm ig bedeutet dass dass jedes Erkennungsergebnis vom Filter akzeptiert werden wird und somit nicht zu den folgenden Plug Ins weitergereicht wird Das Filter Plug In registriert eine Konfigurationsseite im Plug Ins verwalten Dialog wo auch konfiguriert werden kann welche Ergebnisse herausgefiltert werden sollen 90 Allgemein Desktopgitter DS Diktation Der Filter ist ein regul rer Ausdruck der zur Laufzeit evaluiert wird sobald ein Erkennungsergebnis das Plug In erreicht Das Plug In registert Spracheingabekommandos zum aktivieren und deaktivieren des Filters Aussprachetraining Das aussprachetraining wenn
20. kombiniert mit einem guten statischen Basismodell kann ein hilfreiches Werkzeug sein um die Aussprache einer Fremdsprache zu trainieren 91 Chapter 4 simon benutzen Fr r A Aussprachetraining v ex x Aussprachetraining Aufnahme 1 von 128 Apple Ziel 0 lt a Vorheriges be N chstes 3 Beenden Das Plug In wird Sie auffordern W rter auszusprechen Die Erkennung wird dann die Aufnahme analysieren und dabei je nach Aussprache hoffentlich das richtige Wort ausw hlen Wird das richtige Wort erkannt wird anhand der Erkennungsgenauigkeit festgestellt wie nahe Ihre Aussprache an der der Sprecher des Basismodells liegt Da Basismodelle in der Regel von Muttersprachlern aufgenommen wird zeigt die angezeigte Erkennungsrate einen Qualit tsindex Ihrer Aussprache Je hnlicher Sie zu den Muttersprachlern klingen desto h her ist der angezeigte Wert Das Plug In f gt einen Eintrag zum Kommandos Men hinzu um das Training zu starten Das Training selbst besteht aus mehreren Seiten Jede Seite beinhaltet ein Wort das vom aktiven Vokabular geholt wird Die zu train erenden W rter werden per Terminal selektiert der in der Kommandokonfiguration eingestellt wird bevor das Training gestartet werden kann 92 Allgemein Tastatur Das Tastatur Plug In zeigt eine virtuelle sprachgesteuerte Tastatur re es eee ee REM 4AJis la bebe La LK Le be LAL 7 Us Fe Geen Geen Freen Green mm Pm awole i Noj M Die Tastatu
21. sogar W rter verwenden die noch nicht in Ihrem aktivem Lexikon vorkommen solange Sie sie hinzuf gen bevor Sie das n chste mal das Modell synchronisieren obwohl das nicht empfohlen ist Nun bleibt nur noch das Wort aufzunehmen 45 Chapter 4 simon benutzen Wort Hinzuf gen Willkommen Wort definieren Lautst rke Training 1 2 Training 2 2 Fertig Stellen Sie sicher den Richtlinien der Aufnahme Sektion zu folgen Ein Wort adern Um ein Wort zu editieren w hlen Sie es im angezeigten Vokabular aus und klicken Sie auf Wort editieren eu FO wore 200 S Hier k nnen Sie Namen Terminal und Aussprache des ausgew hlten Wortes dern 46 Ein Wort entfernen Um ein Wort aus dem Sprachmodell zu entfernen w hlen Sie es im Vokabular aus und w hlen Sie Ausgew hltes Wort l schen d L Wort l schen simon Wl el Le x Name Links Aussprache INks Terminal Richtung Erkennungsrate 301 e Das Wort zum Terminal Unbenutzt verschieben Das Wort wird in Ihrem aktiven W rterbuch gespeichert bleiben und alle D verwendet werden um ein m glichst genaues Abbild Ihrer Stimme zu erhalten allerdings wird das Wort bei der Erkennung nicht mehr ber cksichtigt _ Werschiebe das Wort zum Schattenvokabular Das Wort wird aus Ihrem aktiven Vokabular entfernt wird aber im Schatterwokabular aufbehalten Die mit dem Wort assozierten Sprachaten Bleiben erhalten und werden wiede
22. wann S e sprechen sollen statt direkt nach dem Moderator zu sprechen oder auf umst dliche Handsignale angewiesen zu sein Mikrofon Damit simon gut funktionieren kann ist ein hochqualitatives Mikrofon empfohlen Aber sogar mit relativ g nstigen Headsets um 30 L erreicht sehr gute Ergebnisse viel bessere als ein m glichereweise integriertes Mikrofon F r maximale Kompatibilit t empfehlen wir USB Headset die in der Regel die notwendige Samplerate von 16kHz direkt unterst tzen Sie sind au erdem gut von sowohl Microsoft Windows als auch von GNU Linux unterst tzt und ben tigen keine speziellen properit ren Treiber Aufnahmen Qualit tskontrolle s mon wird jede Aufnahme mit einigen Kriterien berpr fen um sicherzustellen dass die Aufnahmen nicht fehlerhaft oder von schlechter Qualit t sind 17 Wenn s mon eine problematische Aufnahme erkennt wird er den Benutzer warnen und ihn auffordern die Aufnahme zu wiederholen Derzeit berpr ft simon die folgenden Kriterien e H chste Lautst rkepegel Wenn die Lautst rke zu hoch ist und das Mikrofon beginnt zu bersteuern bersteuern auf Wikipedia http de wikipedia org wiki C3 9Cbersteuern_ 28Signalverarbeitung 29 simon wird automatisch eine Warnung anzeigen die den Benutzer auffordert die Lautstarke des Mikrofons zu senken e Signal zu Rauschen Verh ltnis engl Signal to noise ratio SNR simon wird automatisch das Signal Rausch Verh ltnis f r jed
23. x HADIFIX BOMP herunterladen Die Universitat Bonn benutzt diese Daten nur f r die Statistik Bitte sehen Sie Willkommen ihre Homepage fur weitere Informationen Typ ausw hlen Datei wahlen herunterladen Ihr Name Peter Grasch Email grasch simon listens org A mportiere emer Fertig This data file is being provided to you the licensee by the University of Bonn the author under the following license which applies to any program object code or other work which contains a notice placed by the copyright holder saying it may be distributed under the terms of this Sp license The program below refers to any such program object code iy pan G work E By obtaining using and or copying this program you agree that you have read understood and will comply with these terms and conditions Terms and conditions for the distribution of the data file This data file may not be sold or incorporated into any product which is sold without prior permission of the author This data file may not be iv Ich habe die Lizenzbestimmungen gelesen verstanden und akzeptiere sie lt Zur ck Weiter Abbrechen Mit dem automatischen BOMP Import k nnen Sie nachdem Sie Namen und e Mail Adresse f r die Universit t Bonn angegeben haben das W rterbuch direkt von einem simon listens Server importieren HTK W rterbuch simon kann HTK W rterb cher
24. Das simon Handbuch af e Das simon Handbuch by Peter H Grasch Copyright 2008 2010 Peter Grasch simon ist eine Open Source Spracherkennungsl sung Permission is granted to copy distribute and or modify this document under the terms ofthe GNU Free Documentation License Version 1 2 or any later version published by the Free Software Foundation with no Invariant Sections with no Front Cover Texts and with no Back Cover Texts A copy of the license is included in the section entitled GNU Free Documentation License Inhaltsverzeichnis E ET 2 a EE EEN Pat EN Spracherkennung re E e nee een SIE EE EW GOS EE EE Ier EE Wo bekommen Sie Bassmodelle cece ceceeecccccceceesescccscecssecsssseeuseesessseeeeesseeueeseueseususs Verschiedene Typen von Basismodellen sinne EE Basismodell eege Eeer Adaptieries Bassmodell sen en Bene nee MIO ee ee re Eege Ehe SN tt IT E MEET ze RE EEEEEEEEEEe Avdiy Elle Stille E Ce de EE Aufnahmen KEE Su ara 4 511100 UTE ON EE Das siman Eeer Ben tigte Resourcen f r eine Funktionierende simon Konfoeuraton pre E EE EU rR EE EE EEN EE Ee EE EE e SE E E SEA RE EE Nenes Szenario EEN SP A EE SEA SE EE EIERE EE EE leede ee EE eege Eege Seet ed EE EEN E fe e EE Definition des OPN NIE OR EEEN EEE wtaevebsisiccosetatennostecaeetmaemssenmenesetoent Manuell einen Terminal A cette caesar Secu asve Sse wpsetctsasidadeanbanWedsaueiatondtes Phoneti
25. Ordner wei sofort dass diese Anfrage f r ihn ist In der Praxis bedeutet dass z B dass wenn Sie ein Programm Kommando Firefox haben um den Webbrowser zu ffnen und ein Ort Kommando Google um die Websuche zu ffnen und die Ausl ser Starte f r das Program Plug In und ffne f r das Ort Plug In vergeben m ssten Sie Starte Firefox sagen um Firefox zu starten statt einfach Firefox den Namen des Kommandos wenn Sie keinen Ausl ser verwenden w rden Analog dazu m ssten Sie ffne Google sagen statt nur Google ohne Ausl ser Trigger sind nat rlich keine Voraussetzung und Sie k nnen simon auch ohne Trigger verwenden manche Kommandos haben aber per Default den Ausl ser Computer den Sie in diesem Fall entfernen m ssten Aber sogar wenn Sie nur einen einzelnen Ausl ser f r all Ihre Plug Ins verwenden wie etwa den allgemeinen Trigger Computer um z B Computer Firefox und Computer Google zu sagen hat dies den gro en Vorteil die versehentlichen Kommandoaufrufe zu minimieren s mons Kommando Sektion zeigt den kompletten Satz der mit dem Kommando verbunden ist in der rechten oberen Ecke der Kommandoanzeige an S e k nnen mehrere Instanzen eines Plugins pro Szenario laden Jede Instanz kann unterschiedliche Plugin Ausl ser verwenden Jedes Kommando hat einen Namen der das Kommando mit einem etwaigen Plug In Ausl ser verbunden ausl st ein Symbol und mehrere Felder die vom Typ des Kommandos abh
26. Passwort nicht stimmt wird die Verbindung abgebrochen werden Sehen Sie das simond Handbuch help simond f r mehr Information ber das Einrichten der Benutzer auf dem simond Server Die Erkennung selbst die ja vom Server bernommen wird ist nicht immer verf gbar Beispielsweise ist es nicht m glich die Erkennung zu starten bis der Benutzer sein Akustikmodell das erste mal erzeugt was automatisch gemacht wird wenn bei der Synchronisation alle Zutaten vorliegen Wortliste Grammatik und Trainingsdaten Per Default wird simon die Erkennung sofort starten sobald Sie verf gbar ist Sprach und Akustikmodell wurden konfiguriert Dies kann hier ge dert werden Mit der Option Bei simon Start automatisch verbinden wird simon automatisch zum simond verbinden sobald die Applikation gestartet wurde Netzwerk simon verbindet zum simond ber TCP IP 104 Einrichten simon w l we SCH Erkennungskonfiguration Allgemein Server El Synchronisation gt Allgemein Netzwerk Aufnahmen Brscniusseiwng verwenden Timeout Millisekunden 3000 Sprachmodell Hosts ul i en Modell SE Einstellungen 127 0 0 1 4444 gt Hinzuf gen G Entfernen Erkennung AA Nach oben fe Nach unten EF Social Desktop Hilfe t Voreinstellungen Zur cksetzen w OK amp Anwenden Abbrechen Derzeit simon 0 3 ist Protokollverschlusselung nicht unterst tzt Der angegebene Timeout Wert gibt an wie lange simo
27. Terminale in einen neuen zusammenzuf hren Er dert dabei das aktive Lexikon und auf Wunsch auch das Schattenlexikon und die Grammatik 37 Chapter 4 simon benutzen E E Terminale verbinden WS el amp Terminale ausw hlen Wilkommen Terminale w hlen Verbinden Fertig Diese Funktion ist besonders nutzvoll wenn Sie Ihre Grammatikstrukturen vereinfachen wollen Training Mit dem Trainingsmodul konnen Sie Ihr Akustikmodell und damit die Erkennungsrate verbessern Die Oberfl che listet alle installierten Trainingstexte in einer Tabelle mit drei Spalten Name Ein beschreibender Name fur den Text e Seiten Die Anzahl von Seiten aus der der Text besteht Jede Seite repr sentiert eine Aufnahme Erkennungsrate Analog zum Vokabular Zeigt an wie wahrscheinlich es ist dass simon die W rter die der Text beinhaltet korrekt erkennt h her ist besser Der Wert ist dabei einfach ein Mittelwert der Erkennungsraten aller W rter im Text 58 Mediacenter 19 Um das Akustikmodell zu verbessern und damit die Erkennungsrate m ssen Sie Trainingstexte aufnehmen Trainingsdaten bestehen im Allgemeinen aus zwei Teilen e Sprachaufnahmen Ihrer Stimme e Transkriptionen dieser Aufnahmen Das aktive W rterbuch wird verwendet um die W rter zu transkripieren die Worte in ihre Phoneme aufschl sseln aus denen der Text besteht den Sie vorlesen trainieren Deshalb muss jedes Wort dass in dem Text verwen
28. Training Definition des Wortes Zuerst wird der Benutzer gefragt welches Wort hinzugefiigt werden soll 39 Chapter 4 simon benutzen Wort Hinzuf gen E Krk ENTE Co CL elle ey ge gt i L I u F i e F F my ar Bil J EIIIEKa IGU a Li LG LAL if ff Wilkommen Wort definieren Lautst rke Training 1 2 Training 2 2 Fertig Wenn der Benutzer fortf hrt wird simon automatisch versuchen so viel Information wie m glich ber das hinzuzuf gende Wort im Schattenlexikon zu finden Wenn das Wort im Schattenlexikon vorkommt wird simon automatisch alle ben tigten Felder ausf llen Terminal und Aussprache 40 g di d V Wort Hinzuf gen TARRA W i Definiere Wort Willkommen Wort Wort definieren Terminal NOM S d Lautst rke Training 1 2 Training 2 2 Fertig Wort Betonung Typ Erkennungsrate Test tEst NOM 6 Aussprache tEst hnliche w rter Beispiele __ hnliche W rter inkludieren Alle w rter die den Suchstring beinhalten inkludieren Zur ck Weiter gt Abbrechen Alle Vorschl ge vom Schattenlexikon sind in der Tabelle hnliche W rter aufgelistet Per Default werden nur exakte Treffer angezeigt Allerdings kann dies ge dert werden wenn das H kchen bei der Option Zeige verwandte W rter gesetzt wird Da die meisten Lautschriften relativ leicht zu lesen sind kann dann le
29. ableiten dass das Englische Firefox wie ein Deutsches Feierfox also fal rfO k s ausgesprochen und transkripiert wird So k nnen Sie die Betonung von hnlich ausgesprochenen W rtern ableiten Diese Strategie hat auch den Vorteil dass selbst Laien mit einem guten Schattenlexikon sehr gute Transkriptionen finden k nnen und dabei auch die gleichen Phoneme verwenden die 1m Schattenlexikon vorkommen und somit automatisch f r W rter verwendet werden die im Schattenlexikon gefunden wurden und nur ins aktive Lexikon bernommen worden sind Wir k nnen jetzt die korrekte Aussprache angeben und den Terminal dern 43 Chapter 4 simon benutzen d V Wort Hinzuf gen Wl Ve x Definiere Wort i Wilkommer Wort Firefox Wor definieren Terminal Kommando v d i Lautst rke Aussprache fai rfoks Training 1 2 Training 2 9 hnliche W rter Beispiele i Fertig Wort Betonung Typ Erkennungsrate mech hnliche W rter inkludieren Alle w rter die den Suchstring beinhalten inkludieren Zur ck Weiter gt Abbrechen Trainieren des Wortes Um den Assistenten abzuschlie en k nnen Sie jetzt das Wort zwei mal aufnehmen Falls Sie das nicht tun wollen oder z B ein statisches Modell verwenden k nnen Sie die folgenden zwei Seiten berspringen Weil Sie jetzt gleich zwei Trainingsaufnahmen aufnehmen werden wird simon die Lautst rkeeinpegelung anzeigen um si
30. ario for simon As such the content is of course German Neue Erweiterungen herunterladen simon w el es V i Installieren Details G Details Sortieren nach Bewertung Deinstallieren Details GW B H ufigste Downloads installiert Suchen Deinstallieren Details be i EEE _ Schlie en Fr 23 Chapter 4 simon benutzen Wenn Sie hier Szenarios importieren oder sp ter ber den Szenarioverwaltungsdialog m ssen Sie das Vokabular die Grammatik und die Kommandos nicht selbst konfigurieren Speziell f r neue Anwender ist es deshalb empfohlen ein paar Szenarios hier herunterzuladen um zu sehen wie das System funktioniert Basismodelle In diesem Schritt k nnen Sie simon konfigurieren Basismodelle zu verwenden Wilkommen Szenarios Basisimodelle Server Audioger te Lautst rke Fertig Die Konfigurationsseite die hier ge ffnet wird ist die selbe die in der Verwendung von Basismodelle Sektion erklart wird 24 Nachdem der Einrichtungsassistent abgeschlossen ist oder abgebrochen wurde k nnen Sie die Konfigurationsoptionen dieses Schritts in der simon Konfiguration jederzeit dern Server Intern ist simon eine Server Client Anwendung Wenn Sie Nutzen daraus durch eine netzwerkbasierten Verbindung ziehen wollen k nnen Sie die Serveraddresse hier angeben 23 Chapter 4 simon benutzen ll Telanlani ia Szen
31. arios Bosisrmncocdelle Server Audioger te Laufst rke Fertig Die Standardkonfiguration ist ausreichend fur eine normale Installation und nimmt an dass Sie einen lokalen simond Server verwenden der von simon automatisch gestartet und gestoppt wird Nachdem der Einrichtungsassistent abgeschlossen ist oder abgebrochen wurde k nnen Sie die Konfigurationsoptionen dieses Schritts in der Server Konfiguration jederzeit adern Aufnahmekonfiguration Da simon Sound von einem oder meheren Mikrofonen aufnimmt m ssen Sie simon zuerst sagen welche Ger te er f r das Training bzw die Erkennung verwenden soll 26 Wilkommen Szenarios Basiimodelle Server Audioger te Lautst rke Fertig simon kann ein oder mehrere Ein und Ausgabeger te f r verschiedene Aufgaben verwenden Sie k nnen mehr informationen ber simons Mehrger tef higkeiten in der Soundkonfiguration Sektion nachlesen Wenn Sie nicht zumindest ein Eingabeger t f r die Erkennung definieren werden Sie simon nicht aktivieren k nnen Wenn die Option Powertraining per Default aktiviert ist wird simon beim Trainieren automatisch die Aufnahme starten bzw stoppen wenn der dazugeh rige Prompt angezeigt bzw versteckt wird Diese option setzt nur den Standardwert der Benutzer kann diesen bei jeder Trainingssitzung wieder berschreiben Nachdem der Einrichtungsassistent abgeschlossen ist oder abgebrochen wurde k nnen Sie die Konfigura
32. cherzustellen dass die Lautst rke optimal eingestellt ist F r mehr Informationen sehen Sie bitte die Lautst rkeeinpegelung Sektion s mon wird automatisch versuchen Sie beim Training nach S tzen statt einzelnen W rtern zu fragen Dazu wird simon Ihre Grammatik durchforsten nach Satzstrukturen die den Terminal des neuen Wortes beinhalten und dann anhand der Terminale der anderen W rter in ihrem aktiven Lexikon einen g ltigen Satz bilden Zum Beispiel Sie haben eine Grammatikstruktur Trigger Kommando und haben das Wort Computer vom Terminal Trigger in Ihrem Vokabular Sie f gen dann ein Wort Firefox vom Terminal Kommando hinzu simon wird dann automatisch den Satz Computer Firefox bilden und diesen f r das erste Training des Wortes verwenden weil es laut der Grammatik ein g ltiger Satz ist Wenn simon keinen g ltigen Satz bilden kann z B wenn der Terminal noch nicht in ihrer Grammatik vorkommt oder Sie keine Grammatik definiert haben wird simon Sie einfach nur nach dem einzelnen Wort fragen simon stellt sicher dass die Beispiele f r das erste Training korrekt sind aber Sie k nnen die Vorschl ge jederzeit dern Wechseln Sie dazu zum Beispiel Reiter n der Definiere Wort Seite des 44 Assistenten Wort Hinzuf gen Willkommen Wort definieren u Lautst rke Training 1 2 Training 2 2 Fertig Computer Firefox Firefox Sie k nnen die Beispiele frei editieren Sie k nnen
33. det wird auch in Ihrem aktiven Vokabular vorkommen Ist das nicht der Fall wird simon Sie warnen und die M glichkeit anbieten die fehlenden W rter hinzuzuf gen Das Hinzuf gen ist ganz gleich als w rden Sie ein neues Wort hinzuf gen aber der Assistent wird 59 Chapter 4 simon benutzen automatisch mehrmals durchlaufen um die Information ber alle fehlende W rter zu sammeln Dieser Vorgang kann nat rlich jederzeit abgebrochen werden Sollten Sie das machen wird simon Sie fragen ob er die bisher fertig definierten W rter hinzuf gen soll oder ob alle nderungen r ckg gig gemacht werden sollen Wenn Sie alle W rter hinzugef gt haben werden die nderungen gespeichert und das Training des zuvor ausgew hlten Textes startet automatisch Das Training vorlesen eines Trainingstexts funktioniert exakt gleich wie das erste Training beim Hinzuf gen eines neuen Wortes Stellen S e sicher den Richtlinien der Aufnahme Sektion zu folgen Wilkommen Lautstarke Texte vorlesen Fertig mara OXYGENTIMES Speicherorte Trainingstexte sind an zwei Stellen gespeichert e Linux kde share apps simon texts Windows appdata kde share apps simon texts Die Texte des aktuellen Benutzers K nnen mit simon gel scht und hinzugef gt werden siehe unten e Linux kde4 config prefix share apps simon texts Windows Installationsordner share apps simon texts 60 Systemweite Texte Sie werden bei jedem Be
34. e Aufnahme bestimmen Ist dieses Verh ltnis unter einem konfigurierbaren Level wird eine Warnung angezeigt Der Defaultwert von 5000 bedeutet dass simon nur Samples als korrekt ansieht deren Spitzenpegel 500 mal lauter st als der niedrigste Lautst rke niedrigste Lautst rke wird als niedrigster Durchschnitt von jeweils 50 Millisekunden errechnet Oft ist dies ein Problem von sehr schlechten Mikrofonen hohen Leveln von Umgebungsger uschen oder eine kleine Mikrofonlautstarke in Verbindung mit einem Signalboost im Systemmixer SNR Warnungen werden naturgem auch von leeren Aufnahmen ausgel st Dieser Dialog wird bspw Angezeigt wenn auf den Mehr Information Knopf gedr ckt wird sichtbar im Hintergrund 8 Warnung simon simon hat erkannt dass zumindest eines der aufgenommenen Samples ein Problem haben k nnte w hlen Sie Mehr Information um herauszufinden wie Sie das Problem l sen k nnen Wollen Sie mit dem Training fortsetzen ohne das Problem zu l sen Diese Nachfrage nicht mehr anzeigen Fortsetzen Abbrechen 18 Chapter 4 simon benutzen Die folgende Sektion wird die normale Benutzung von simon beschreiben Das simon Hauptfenster Lei l simon Datei Szenarios Erkennung Module Kommandos Aktionen Einstellungen Hilfe Sind gt Fi gt i i B i DI Ga ve re i ch Ken NE M r ee Z Das simon Hauptfenster bietet schnellen Zugriff auf die wichtigsten Funkt
35. ehr als einem Audioger t gleichzeitig verwenden Verwenden Sie Ger t hinzuf gen um ein Ger t zu Ihrer Konfiguration hinzuzuf gen und Ger t entfernen um das Ger t wieder zu entfernen Das erste Ger t n Ihrer kann nicht entfernt werden F r jedes Ger t k nnen Sie bestimmen wof r es verwendet werden soll Training oder Erkennung letzteres ist nur f r Eingabeger te verf gbar Wenn Sie mehr als ein Ger t f r das Training verwenden wird simon mehrere Tondateien pro Trainingsaufnahme sammeln Wird mehr als ein Ger t f r die Erkennung verwendet werden mehrere Datenstr me zum Server aufgebaut was in mehreren Erkennungsergebnissen eines pro Mikrofon resultiert 97 Chapter 4 simon benutzen Wenn Sie mehr als ein Ausgabeger t verwenden wird ein Ton auf allen konfigurierten Ger ten gleichzeitig wiedergegeben Wenn S e unterschliedliche Samplerates f r Ihre Eingabeger te verwenden wird die Ausgabe nur auf diesen Ausgabeger ten stattfinden die ebenfalls die selbe Samplerate verwenden Verwenden Sie beispielsweise ein Eingabeger t mit 16kHz und eines mit 48kHz wird die Wiedergabe von Aufnahmen die mit dem ersten Ger t aufgenommen wurden nur auf Ausgabeger ten stattfinden die auf 16kHz konfiguriert sind wohingegen Aufnahmen mit 48kHz nur auf Wiedergabenger ten abgespielt werden die selbst auf 48KHz eingestellt sind Sprachaktivit tserkennung Die Erkennung selbst geschieht auf dem simond Server Sehen Sie die Architekt
36. eibung Klickt 3 Icon anzeigen Nein Sichtbarer Trigger 3 Ausl ser C Bearbeiten L schen Fertig amp Details Das Diktationsplug in schreibt das Erkennungsergebnis mit simulierten Tastendr cken hin Wenn das Diktationsplug in ohne Ausl ser verwendet wird wird das Plug In alle Erkennungsergebnisse akzeptieren die es bekommt und diese einfach hinschreiben Das hei t dass alle Plug Ins die unter einem Diktationsplug n ohne Ausl ser gereiht sind werden dadurch nie ein Erkennungsergebnis erhalten Weil keine Kommandos vom Typ Diktation angelegt werden k nnen scheint das Diktationsplug in nicht im Neues Kommando Dialog auf Das Diktationsplugin kann so konfiguriert werden beliebigen Text nach jedem Erkennungsergebnis anzuh gen 86 Allgemein Desktopgitter T K nstliche Intelligenz Das k nstliche Intelligenz Plug In ist ein Plug In dass eine menschliche Kommunikation simuliert Die KI k nstliche Intelligenz verwendet das festival text to speech um Sprache auszugeben und somit mit dem Benutzer zu sprechen Fragen beantworten oder z B ber das Wetter tratschen Das Plug In benutzt AIMLs f r die Intelligenz Der Gro teil der AIML Sets sollten unterst tzt sein Der bekannte A L I C E Bot http www pandorabots com pandora talk botid f5d922d97e345aal und eine deutsche Version wurden getestet funktionieren und werden mit ausgeliefert Das Plug In registriert eine Kon
37. ektur von simon besteht aus drei Anwendungen simon Das grafische Interface Es ag ert als Client zum simond Server simond Der Erkennungsserver ksimond Das grafische Frontend f r simond Diese drei Komponenten bilden eine Server Client Anwendung Das bedeutet dass ein Server simond mehrere Clients simon Diese Anwendung bedient welche ber das Netzwerk angebunden sind KSimond ist nur ein Frontend f r simond was bedeutet dass es keine zus tzliche Funktionalit t zum System einbringt aber einen Weg bietet mit simond ber eine grafische Benutzeroberfl che zu interagieren Neben simon simond und ksimond sind andere speziellere Applikationen auch Teil der integrierten s mon Distribution sam Bietet direkten Zugang zum Sprachmodell um dieses zu testen oder zu generieren ssc sscd Diese beiden Applikationen k nnen verwendet werden um eine gro e Menge an Sprachdaten von verschiedensten Personen leicht aufzunehmen Bitte sehen Sie die einzelnen Handb cher dieser Applikationen f r mehr Details Chapter 2 bersicht synchronization Leg V TCP IP TCP IP A Synchronization simon wird verwendet um eine Repr sentationIhrer Aussprache und Ihres Wortschatzes zu verwalten Diese Repr sentationwird dann an den Server simond geschickt welcher sie in ein benutzbares Sprachmodell bersetzt kompiliert simon nimmt mit Hilfe von einem Mikrofon dann Ihre Stimme auf und sendet diese Aufnahme an d
38. en Server welcher die Erkennung auf diesen Datenstrom ausf hrt simond sendet dieses Erkennungsergebnis dann zur ck an den Client simon simon benutzt dieses Erkennungsergebnis dann um Kommandos auszuf hren wie beispielsweise das Offnen von Programmen oder URLs simond identifiziert die Verbindung mit einem Benutzernamen und einem Passwort die komplett unabh gig sind vom zugrunde liegenden Betriebssystem und dessen Benutzerkonten Standardm ig kommt simond mit einem Standardbenutzer in sowohl simon als auch simond so das der typische Anwendungsfall von einem simon Client auf einem simond Server ohne zus tzliche Konfiguration funktionieren wird Jeder simon Client meldet sich am Server mit einem Benutzernamen und einem Passwort an das einen eindeutigen Benutzer mit ein eindeutiges Sprachmodell identifiziert Jeder Benutzer verwaltet sein eigenes Sprachmodell aber kann es von verschiedenen Computern verschiedene physische simon Instanzen verwenden einfach indem er den selben simond Server verwenden Eine simond instanz kann nat rlich mehrere Benutzer verwalten Wenn Sie einen Server zum Internet hin ffnen wollen oder mehrere Benutzer auf einem simond Server verwenden wollen m ssen Sie den Server entsprechend konfigurieren Bitte sehen Sie das simond manual help simond f r Details Spracherkennung Hintergrundwissen Spracherkennungssysteme verwandeln Spracheingabe von einem Mikrofon und versuchen diese in einen geschriebenen
39. en Trainingsdaten anhand der Dateinamen auslesen Eine Datei die das ist ein Text wav genannt ist muss die Worte das ist ein Test beinhalten und nichts anderes Satzzeichen wie in den Dateinamen werden ignoriert Dateien die mit simon 0 2 aufgenommen wurden werden automatisch dieser Namensgebung folgen sodass Sie sie ohne Probleme importieren k nnen sollten Dateien Die von vorigen Versionen von simon aufgenommen wurden sollten nicht importiert werden Sie k nnen diese Aufnahmen aber nat rlich ber den Prompts basierten Import importieren Die Dateien und Ihre Transkription werden dann zum Trainingskorpus hinzugef gt Um einen Ordner zu importieren der die Trainingsdateien beinhaltet w hlen Sie ihn und abh gig vom Importierungstyp auch die entsprechende Prompts Datei im Assistenten aus C x d LZ Importiere Trainingsdaten wl Je Trainingsdaten importieren willkommen beim Import von bestehenden Trainingsdaten Mit Willkommen diesem Assistenten k nnen Sie bestehnde Datenkollektionen z mportiere B von anderen simon Installationen importieren Fertig e Importiere Prompts Prompts RBATIM VoxforgeDE 1 6kHz_16bit all_ prompts txt a H Basisordner media VERBATIM VoxforgeDE 16kHz 16bit i Importiere Ordner Zur ck Weiter gt Abbrechen Der Ordner wird rekursiv durchsucht Das hei t dass der angegebene Ordner und all seine Unterordner nach wav flac
40. entsprechenden Terminal ersetzten In unserem Beispiel w rde das bedeuten dass werden Satz Computer Internet finden w rde simon w rde dann erkennen dass Computer vom Terminal Trigger und Internet vom Terminal Kommando ist Deswegen w rde simon lernen dass Trigger Kommando offensichtlich ein g ltiger Satz ist und ihn automatisch zur Grammatik hinzuf gen mn wee Der Import segmentiert den Eingabetext automatisch nach Satzzeichen etc also jeder nat rliche Text sollte funktionieren Der Import wird automatisch alle doppelt vorkommenden Satzstrukturen zusammenf gen sogar ber verschiedene Dateien verstreut und wird alle m glichen grammatikalischen Satzstrukturen hinzuf gen wenn S tze W rter verwenden die mit mehr als einem Terminal assoziiert sind Der Import wird alle S tze ignorieren die ein oder mehrere W rter beinhalten die im Sprachmodell n cht gefunden werden konnten au er die Option Auch unbekannte W rter akzeptieren wurde aktiviert In diesem Fall werden unbekannte W rter mit dem generischen Terminal Unbekannt ersetzt Terminale umbenennen Der Terminal umbenennen Assistent erlaubt es dem Benutzer einzelne Terminale im akt ven Vokabular dem Schattenlexikon und in der Grammatik umzubenennen 56 Terminal umbenennen nNeu Wilkommen Parameter Umbenennen Fertig Terminale verbinden Der Terminal verbinden Assistent erlaubt es zwei
41. er oder eine lokale Datei anzugeben w hlen Sie Lokaler Ort und w hlen Sie den Ordner oder die Datei mit dem Feld aus G Um einen entfernten URL HTTP FTP etc anzugeben w hlen Sie URL http google at eem Bitte beachten Sie dass URLs mit Authentifizierungsinformation im Klartext gespeichert werden und das Passwort also unverschl sselt vorliegt Tastenk rzel Kommandos Mit den Tastenk rzel Kommandos kann ein Benutzer Kommandos mit Tastenkombinationen verbinden 73 Chapter 4 simon benutzen Das Kommando kann Tasteneingaben simulieren um Tastenk rzel wie Strg C oder Alt F4 auszul sen do Speichern 3 IR T Si FI q vi i MY ET Z Sp eichern Ing Speichert das Dokument durch dr cken von Strg S5 Um ein Tastenk rzel auszuw hlen klicken Sie einfach auf den Tastenk rzel Knopf und dr cken anschlie end eben jene Kombination die Sie mit dem Kommando assozieren m chten auf Ihrer Tastatur simon wird das Tastenk rzel abfangen und mit dem Kommando assozieren Wegen technischen Einschr kungen gibt es unter Microsoft Windows einige Tastenk rzel die sich nicht ohne weiteres abfangen lassen mit simon z B Strg Alt Entf und Alt F4 Diese speziellen Tastenkombinationen k nnen mit einer eigenen Liste ausgew hlt werden Note Diese Auswahlliste ist im Bildschirmfoto nicht sichtbar da sie nur unter Microsoft Windows angezeigt wird 74 Text Makro Kommandos Mit Text Makro
42. erst tzt und an das Programm bergeben Wenn der Pfad zur ausf hrbaren Datei oder die Argumente Leerzeichen beinhalten m ssen sie aber von Anf hrungszeichen umgeben werden Nehmen wir die ausf hrbare Datei C Programme Mozilla Firefox firefox exe C test datei html an w re die korrekte Eingabe f r das Feld Ausf hrbare Datei folgendes C Programme Mozilla Firefox firefox exe C test datei html Der Arbeitsordner bestimmt in von welchem Ordner aus der Prozess gestartet wird Wenn der Arbeitsordner C folder ist und das Kommando C Programme Mozilla Firefox firefox exe file html gestartet wrid w rde Firefox f r die Datei 70 C folder file html suchen Der Arbeitsordner muss normalerweise nicht explizit gesetzt werden und kann leer gelassen werden Programme importieren simon bietet einen Dialog mit dem Sie Programme auch direkt aus dem KDE Men ausw hlen k nnen Note Diese Option ist unter Microsoft Windows nicht verf gbar SCH L Programm ausw hlen simon u el G X Nicht zuzuordnen Ke AD KMail E Mail Programm Entwicklung KNode Usenet Newsreader EI bersetzung Google Gadgets Qt E Lernprogramme Gi Verschiedenes 3 Spiele a Amazon MP3 Downloader Quassel IRC nur Client IRC Clie Yncviewer S Co rekong Webbrowser GE Weitere Programme amp KNetAttach Assistent f r Netzw Es Einstellungen O Opera Web Browser 30 System KVpne VPN Cl
43. figurationsseite in der Kommandokonfiguration in der Sie das zu 87 Chapter 4 simon benutzen verwendende AIML Set ausw hlen k nnen simon wird die AIML Sets in den folgenden Ordnern suchen e GNU LINUX gt kde4 config prefix share apps ai aimls e Microsoft Windows Installation Ordner C Programme simon 0 2 per Default share apps ai aimls Um die Pers nlichkeit der Bots anzupassen bearbeiten Sie bitte die Dateien bot xml und vars xml in den folgenden Ordnern e GNU Linux kde4 config prefix share apps ai util e Microsoft Windows Installationsordner C Programme simon 0 2 per default share apps ai util Das Plug In wird die mbrola Stimmen http tcts fpms ac be synthesis mbrola html verwenden wenn diese installiert sind Weil keine Kommandos vom Typ Diktation angelegt werden k nnen scheint das Diktationsplug in nicht im Neues Kommando Dialog auf Es wird empfohlen keinen Trigger f r dieses Plug_in zu verwenden um die Gespr che nat rlicher zu machen Das AI plugin wird auf jedes Erkennungsergebnis in irgendeiner Form reagieren aber gleichzeitig im Gegensatz zur Diktation das Erkennungsergebnis an die anderen Plug Ins weitergeben Das erm glicht es mit speziellen AIML Sets Kommandos in eine nat rliche Konversation einzubauen Zum Beispiel k nnte das KI Plug In instruiert werden auf ein Erkennungsergebnis wie Computer Firefox zu antworten mit Firefox wird gestartet da das Erkenn
44. figurieren die f r den automatischen BOMP Import verwendet wird Die Standardeinstellung zeigt auf die Kopie auf dem simon listens Server Erkennung Hier konnen Sie die Erkennung und die Modellsynchronisation mit dem simond Server konfigurieren Server Mit der Serverkonfiguration kann die Verbindung zum simond Server angepasst werden Allgemein Die simon Hauptapplikation verbindet zum simond Server siehe die Architektur Sektion fur mehr Informationen 103 Chapter 4 simon benutzen i e Einrichten simon ewe xy Erkennungskonfiguration Allgemein g Sever synchronisation Allgemein Netzwerk Aufnahmen Starte den Server beim simon Start automatisch a Stoppe den Server beim simon Stop automatisch Sprachmodell simond konfigurieren ol Bei simon Start automatisch verbinden Modell sw Erkennung automatisch starten sobald verf gbar Einstellungen Benutzername default G Passwort ETTTTTTTTT Erkennung f La Aktionen CX Social Desktop i 5 Ge I I T Hilfe t Voreinstellungen wenden Abbrechen Um die einzelnen Anwender des Systems ein simond Server kann naturlich mehrere simon Clients bedienen zu identifizieren f hrt simon Benutzer ein Jeder Benutzer hat sein eigenes Sprachmodell Die Benutzername Passwort Kombination die hier angegeben werden kann wird verwendet um sich damit bei simond anzumelden Wenn der simond diesen Benutzernamen nicht kennt oder das
45. flektiert was sie in unserem Szenario sein sollen Table 4 3 Verbessertes Beispielvokabular Jetzt dern wir die Grammatik zu folgendem Trigger Kommando Dies erlaubt simon alle gew nschten Kombinationen zu erkennen Aber es limitiert die Erkennugsergebnisse auch auf exakt diese drei m glichen S tze Vor allem in gr eren Modellen kann eine clevere Grammatik und ein dazupassendes Vokabular gro e Unterschiede in der Erkennungsrate bewirken Die Grammatik definieren simon bietet eine einfache Text basierte Oberfl che um die Grammatik zu definieren Sie k nnen einfach alle erlaubten S tze ohne Satzzeichen wie oben beschrieben eingeben 32 Computer close Computer Internet Computer Mail Wenn Sie einen Satz links ausw hlen wir das Feld rechts automatisch echte S tze die mit Ihrem aktuellen Vokabular dadurch erm glicht werden anzeigen Die Beispielsektion erlaubt maximal 35 Beispiele sodass die Liste nicht vollst dig sein muss Eine Grammatik importieren Zus tzlich zum Eingeben der Grammatik Satz bei Satz kann simon auch Satzstrukturen von Textdateien erlernen 53 Chapter 4 simon benutzen Grammatikstrukturen Importieren Willkommen Eingabedaten Importiere Fertig simon kann Textdateien einlesen aber erlaubt auch direkte Eingabe von Text in ein Eingabefeld Wenn wir bspw ein Vokabular wie vorhin in der allgemeinen Sektion haben Table 4 4 Verbessertes Beispielvokabular
46. gen siehe unten Einige Kommandoplugins bieten vielleicht eine Konfiguration f r das Plugin selbst an nicht die Kommandos die es verwaltet Diese Konfigurationsseiten werden direkt in den Plug Ins konfigurieren Dialog eingebunden unter dem Allgemein Men eintrag wenn Sie das Plugin laden 68 Plug Ins die eine grafische Benutzeroberfl che anbieten zum Beispiel das Nummer eingeben Kommandoplugin k nnen ber Sprachkommandos konfiguriert werden Sie k nnen das assoziierte Wort dern das den grafischen Knopf ausl st dern aber auch das angezeigte Symbol usw Wenn Sie alle Sprachkommandos von einem grafischen Element entfernen wird das Element nicht mehr angezeigt versteckt Sprachkommandos k nnen gleich wie normale Kommandos durch die Kommandokonfiguration verwaltet werden Kommando Eins simon Um ein neues Sprachkommando zu einer Funktion hinzuzuf gen w hlen Sie die Aktion die Sie mit dem Kommando verbinden wollen aus und klicken Sie Von Vorlage erzeugen Passen Sie die erzeugten Werte an Ihre W nsche an Einige Plug Ins zum Beispiel das Desktopgitter oder der Taschenrechner k nnen auch einen Men eintrag im Kommando Men anzeigen simon 69 Chapter 4 simon benutzen Programm Kommandos Programm Kommandos sind assoziiert mit einer ausf hrbaren Datei Programm welches gestartet wird wenn das Kommando ausgel st wird Argumente zu den ausf hrbaren Dateien werden unt
47. gnal Ger usch Verh ltnis 5000 iz Sprachmodell Lautst rkeeinpegelung ul Mindestlautst rke 20 Modell i aA Einstellungen Maximallautstarke 100 7 Sogar bei 100 Maximallautstarke wird simon den Benutzer bitten die Lautst rke zu verringern wenn Erkennung Clipping auftritt H Text f r die Lautst rkeeinpegelung Er Aktionen Social Desktop Hilfe t Voreinstellungen Zur cksetzen S OK Anwenden Abbrechen Wenn die Option Powertraining per Default aktiviert ist wird simon beim Trainieren automatisch die Aufnahme starten bzw stoppen wenn der dazugeh rige Prompt angezeigt bzw versteckt wird Diese option setzt nur den Standardwert der Benutzer kann diesen bei jeder Trainingssitzung wieder berschreiben Der Text der aufgenommen werden soll um das Akustikmodell zu trainieren wird in einer konfigurierbaren Schriftart angezeigt Die zu verwendende Schriftart und vor allem die Gr e k nnen hier ge dert werden Diese Option wurde eingef hrt nachdem wir mit einigen Kunden Tests durchgef hrt haben die unter infantiler Zerebralparese Spastische L hmung leiden W hrend wir mit der Maus simon bedienten um sie durch das Training zu f hren mussten Sie 1m Rahmen des Trainings vorlesen was am Bildschirm geschrieben stand Im Laufe des Tests fanden wir heraus dass es unseren Probanden teilweise schwer fiel die kleine Schrift zu entziffern Deshalb f hrten wir eine eigene Konfigurationsoptio
48. h lt grasch simon listens org gt This documentation is licensed under the terms of the GNU Free Documentation License common fdl license html This program is licensed under the terms of the GNU General Public License common gpl license html JI Appendix A Installation Bitte sehen Sie unser online Wiki http www cyber byte at wiki index php English Setup for eine detaillierte Installationsanleitung 112
49. hmen Starte simon bei der Anmeldung wv Nachfragen vor dem Beenden Keine Warnung anzeigen wenn simon einen Fehler mit einer Aufnahme erkennt Sprachmodell Pu ul Modell Einstellungen Erkennung E EF Aktionen Social Desktop Hilfe Voreinstellungen Zur cksetzen W OK SS Anwenden Abbrechen Die Option simon beim Anmelden zu starten wird sowohl unter Microsoft Windows als auch unter KDE unter GNU Linux funktionieren Um andere Desktopumgebungen wie GNOME XFCE etc zu unterst tzen m ssen Sie aber simon wahrscheinlich manuell 1m Sitzungs Autostart platzieren bitte sehen S e die Handb cher Ihrer Desktopumgebung f r mehr Informationen Wenn die Option zum minimiert Starten von simon gesetzt ist wird das simon Hauptfenster beim simon Start nicht angezeigt sondern sofort in den Systembereich der Taskleiste minimiert Wenn Sie die option ausw hlen nicht zu warnen wenn Probleme mit Aufnahmen auftreten deaktiviert die Aufnahmen Qualitatskontrolle Aufnahmen simon benutzt QtMultimedia um Ton aufzunehmen und wiederzugeben QtMultimedia wird au erdem dazu verwendet einen Datenstrom vom Mikrofon an den Erkennungsserver zu senden Ger tekonfiguration Die Ger tekonfiguration erlaubt Ihnen das jeweilige Audioger t auszuw hlen das Sie f r die Aufnahme und Wiedergabe in ganz simon verwenden m chten Au erdem k nnen s e auch angeben in wievielen Kan len und bei welcher Samplerate Sie aufnehmen wollen 96 Der Defau
50. icht aus hnlichen W rtern die Korrekte Aussprache abgeleitet werden Das h gt nat rlich von Ihrem Schattenlexikon ab Wenn das Schattenlexikon die W rter die S e hinzuf gen wollen nicht beinhaltet m ssen die notwendigen Felder manuell ausgef llt werden Manche W rterb cher die von simon importiert werden k nnen SPHINX HTK unterscheiden nicht zwischen Gro und Kleinschreibung und beinhalten alle W rter in Gro buchstaben Nat rlich kann die Schreibweise beim Hinzuf gen frei ge dert werden Einige W rterb cher die von simon importiert werden k nnen SPHINX PLS und HTK beinhalten keine grammatikalische Information Da alle W rter in simon einen Terminal besitzen m ssen werden sie dem Terminal Unbekannt zugewiesen wenn Sie importiert werden Sie sollten beim Hinzuf gen der W rter zum aktiven Lexikon dann den Terminal entsprechende dern Manuell einen Terminal ausw hlen Der Terminal des Wortes ist definiert als die grammatikalische Kategorie des Wortes Das kann im Sinne der deutschen Grammatik Nomen Verb oder etwas komplett anderes wie erfundene Kategorien wie Kommando sein F r mehr Information sehen Sie bitte die Grammatik Sektion Die Liste beinhaltet alle Terminale die bis jetzt in Ihrem aktiven und Schattenlexikon sowie in Ihrer Grammatik verwendet wurden S e k nnen neue Terminale zu der Liste hinzuf gen indem Sie das gr ne Plus verwenden 41 Chapter 4 simon benutzen Phonetische Transk
51. ie Kompilierung die auch fuer statische Modelle notwendig ist um das Sprachmodell zu erzeugen nicht ohne sie starten Falls Ihr Basismodell diese Dateien nicht mitliefert k nnen Sie einfach leeren Dateien angeben Vokabular Das Vokabular erm glicht es dem User die verf gbaren W rter zu verwalten Allgemein Das Vokabular definiert welche W rter der Erkennungsprozess erkennen sollte Jedes Wort dass simon erkennen k nnen soll muss in der Wortliste vorkommen Ein einzelner Eintrag in der Wortliste definiert exakt ein Wort Ein Wort bedeutet in simon eine einzigartige Kombination aus e Wordname Das geschriebene Wort selbst e Terminal 36 Grammatik Kategorie Z B Nomen Verb etc e Aussprache Wie das Wort ausgesprochen wird s mon akzeptiert alle Formen von Lautschrift solange Sie weder Zahlen noch Sonderzeichen beinhaltet Das bedeutet dass Mehrzahlformen oder Unterschiede in Gro Kleinschreibung als unterschiedliche W rter behandelt werden Dadurch erlaubt eine ausgefeilte Grammatik noch mehr Kontrolle Generell ist es empfohlen das Vokabular so klein wie m glich zu halten Je mehr W rter die Wortliste umfasst desto wahrscheinlicher ist es dass simon etwas falsches erkennt Beispiel Vokabular bitte beachten Sie dass die Terminale auf Nomen Verb gesetzt sind um das Verst dnis zu erleichtern Bitte sehen Sie die Grammatik Sektion warum dies nicht optimal ist Table 4 1 Beispiels Vokab
52. ient GUI Sl E gt lt gt ww ok Abbrechen Der Dialog wird alle Programme aus dem KDE Men in ihrer entsprechenden Kategorie anzeigen Unterkategorien werden nicht unterst tzt und werden auf der selben Ebene wie ihre bergeordneten Kategorien angezeigt W hlen Sie einfach das Programm aus das Sie importieren wollen und schlie en klicken Sie Ok Die korrekten Werte f r die Ausf hrbare Datei und f r den Arbeitsordner werden automatisch ausgef llt Ort Kommandos Mit Ort Kommandos kann simon einen beliebigen URL ffnen Weil simon die Adresse einfach an den zugrunde liegenden URL Handler der jeweiligen Plattform weitergibt werden alle von diesem Unterst tzten Protokolle wie remote Linux KDE spezifisch oder sogar KDEs Web Shortcuts unterst tzt Neben herk mmlichen Ordnern k nnen aber auch Dateien angegeben werden die dann mit dem mit 71 Chapter 4 simon benutzen ihnen standardm ig assoziierten Programm ge ffnet werden wenn das Kommando ausgel st wird Kommando Eigene Dateien simon be E E e en Trigger Eigene Dateien 19 Lokalen Pfad ffnen home bedahr Ei a ii m en Or auswanlen Um einen URL mit einem Kommando zu verbinden k nnen Sie den URL entweder manuell in das URL Feld eingeben w hlen Sie Manuell oder ihn mit dem Ort importieren Dialog ausw hlen Orte importieren Der Ort importieren Dialog erleichtert es eine korrekte URL anzugeben Um einen lokalen Ordn
53. igt werden kann indem die entsprechende Option inder Konfiguration gesetzt wird 94 I L lr Zahlenblock Nummer l schen lin IH sl cn Gu Nummer ausw hlen Nummer hinschreiben Neben den Nummerntasten existiert ein eigener L schen Knopf f r das Nummereingabefeld Nummer l schen und zwei Kn pfe die bestimmen was mit der eingegebenen Nummer geschehen soll Wenn Nummer hinschreiben ausgew hlt wird wird die eingegebene Nummer mit simulierten Tastendr cken hingeschrieben Nummer ausw hlen hingegen sucht einen Knopf der diese Nummer als Trigger konfiguriert hat und l st diesen aus Auf diese Weise k nnen Sie eine komplette Tastatur nur mit Nummern bedienen A 1 Tasten Sonderzeichen Nummernbasiert Funktionstasten B 2 3 D 4 E 5 Textschnipsel F 6 G 7 steuerung Gro schreiben Zahlenblack i 8 4 3 L 2 H Nummer ausw hlen Nummer hinschreiben Super Die Tasten auf dem Nummernpad sind konfigurierbare Spracheingabekommandos Konfiguration simon ist auf extrem hohe Konfigurabilitat ausgelegt Nummer l schen ja iu Ok 95 Chapter 4 simon benutzen Allgemein Die allgemeine Konfiguration bietet einige basische Optionen d ZS Einrichten simon wy Le X m Konfiguration der allgemeinen simon Einstellungen m Allgemein v Erststartassistent beim n chsten Start nicht anzeigen u _ Starte simon minimiert Aufna
54. imon mit einem leeren Szenario namens Standard Wenn Sie keine weitere Einstellungen vornehmen werden Ihre pers nlichen Einstellungen dort gespeichert Um ein anderes Szenario zur Bearbeitung auszuw hlen z B vor dem Hinzuf gen neuer W rter w hlen Sie das Szenario einfach in der in der Auswahlliste im oberen rechten Eck des Hauptfensters aus 28 simon 7 Einstellungen Hilfe Um die verf gbaren Optionen zu dern klicken Sie Szenarios verwalten oder verwenden Sie den Men eintrag Szenarios gt Szenarios verwalten Szenarios verwalten Der Szenario verwaltungsdialog erlaubt Ihnen Szenarios zu laden neue zu importieren oder vorhandene in Dateien oder direkt in eine Onlinesammlung zu exportieren Szenarios verwalten simon B DEIHB Skype ta DE HB Fensterverwaltung 1 standard Um ein Szenario zu laden oder zu entladen verwenden Sie die Kn pfe mit Pfeilsymbolen oder doppelklicken Sie das entsprechende Szenario in den Listen Mehr Informationen ber die Szenarios selbst k nnen Sie in dem Tip lesen der erscheint wenn die Maus einige Zeit ber ein Element halten 29 Chapter 4 simon benutzen Neues Szenario hinzuf gen Um ein neues Szenario hinzuzuf gen w hlen Sie den Hinzuf gen Knopf aus Ein Dialog wird angezeigt 7 amp Szenario DE VF Taschenre 2 e x Name Taschenrechner Szenario Version 3 a ch Minimale simon Version 0 2 97 Maximale simon version Lizenz
55. importieren Ein Beispiel eines HTK Worterbuchs ist das Englische Voxforge W rterbuch http www repository voxforgel org downloads SpeechCorpus Trunk Lexicon HTK W rterb cher bieten Ausspracheinformationen aber keine Terminale Alle W rter werden dem Terminal Unbekannt zugewiesen PLS W rterbuch simon kann PLS W rterb cher importieren Ein Beispiel eines PLS Worterbuches ist das Deutsche GPL Worterbuch von Voxforge http www repository voxforgel org downloads de Trunk Lexicon PLS W rterb cher bieten Ausspracheinformationen aber keine Terminale Alle W rter werden dem Terminal Unbekannt zugewiesen 50 SPHINX W rterbuch simon kann SPHINX W rterb cher importieren Ein Beispiel eines SPHINX W rterbuches ist das W rterbuch f r Mexikanisches Spanisch http speech mty itesm mx jnolazco proyectos htm SPHINX W rterb cher bieten Ausspracheinformationen aber keine Terminale Alle W rter werden dem Terminal Unbekannt zugewiesen Julius W rterbuch simon kann Julius W rterb cher importieren Ein Beispiel eines Julius Vokabulars sind Wortlisten von simon 0 2 Julius W rterb cher bieten Ausspracheinformationen und Terminalinformationen Grammatik Die Grammatik definiert welche Wortkombinationen korrekt sind Allgemein Beispiel Sie wollen simon benutzen um Programme zu starten und die Programmfenster zu schlie en wenn Sie fertig sind Sie wurden gerne die folgenden Kmmandos verwenden
56. in ein einzelnes Kommando packen Zum Beispiel Starte Kopete Program Kommando Warte 2000ms bis Kopete gestartet ist Schreibe Mathias Text Makro Kommando Dies wird den Kontakt Mathias in meiner Kontaktliste ausw hlen Dr cke Eingabe Tastenk rzel Kommando Warte 1000ms bis Kopete das Chatfenster ffnet Schreibe Hallo Text Makro Kommando und dr cke Eingabe Tastenk rzel Kommando um die Nachricht zu senden Dr cke Alt F4 Tastenk rzel Kommando um das Chatfenster zu schlie en 80 e Dr cke Alt F4 Tastenk rzel Kommando um das Kopete Hauptfenster zu schlie en Desktopgitter Das Desktopgitter erlaubt dem Benutzer die Maus mit der Sprache zu steuern e T Ere F gt Mu timedia gt Bild gt wallpaper Das Desktopgitter teilt den Bildschirm in neun Teile die von 1 9 durchnummeriert werden Wenn eine der neun Nummer ausgesprochen wird wird das Feld das mit dieser Nummer verbunden war in neun weitere Felder zerteilt die wieder von 1 9 durchnummeriert werden etc Dies wird insgesamt drei Mal gemacht Nach der vierten Auswahl einer Zahl der immer kleiner werdenden Teile des Bildschirms wird in die Mitte des verbleibenden Vierecks geklickt mit der linken Maustaste Die Exakte Aktion die beim Klick ausgew hlt wird ist konfigurierbar Standardm ig wird der benutzer jedes mal durch eine Liste gefragt Wird Drag and Drop ausgew hlt wird das Desktopgitter nocheinmal angezeig
57. informieren Versuchen Sie w hrend der Kalibrierung so normal wie m glich zu sprechen Schreien Sie nicht aber seien Sie auch nicht unn tig leise Bitte bedenken Sie dass Sie die besten Ergebnisse erzielen wenn alle Aufnahmen ungef hr gleich laut sind und Sie auch w hrend der Erkennung gleich laut sprechen M glicherweise k nnten Sie zu anderen Tageszeiten oder einer anderen Stimmung lauter sprechen also sprechen Sie in diesem Test lieber etwas lauter um diese M glichkeit einzukalkulieren Grunds tzlich sind zu leise Aufnahmen viel besser als zu laute da es dann zu Verzerrungen kommen kann In den Einstellungen von simon l sst sich sowohl der angezeigte Text als auch die Lautst rken die als korrekt bzw inkorrekt markiert werden konfigurieren Wird der dortige Text leer gelassen Standard wird ein Standardtext angezeigt In der Konfiguration k nnen Sie die Lautstarkenkalibrierung auch komplett deaktivieren Sehen Sie Training Sektion f r mehr Details Audacity Kalibrierung Ein alternativer Weg um sicherzustellen dass die Lautst rke richtig eingestellt ist ist ein Audio Tool wie das freie Audacity http audacity sf net zu benutzen Zu leise Zu laut WAN DM MM a Optimale Lautstarke 15 Stille Um simon mit der automatischen Segmentierung zwischen den W rtern zu helfen empfehlen wir vor und nach dem Sprechen ca ein bis zwei Sekunden Stille aufzunehmen Die aktuelle simon Version inkludiert eine g
58. inzelnen Dateien der jeweiligen simond Benutzer nat rlich frei anpassen Die nderungen am systemweiten Template beeinflussen dadurch aber keine bereits angelegten Benutzer Der Pfad zu den Julius Konfigurationsdateien wird von der verwendeten Plattform abh gen Table 4 5 Julius Konfigurationsdateien Datei Microsoft Windows GNU Linux adin jconf System Installationspfad share apps s kde4 config imon adin jconf prefix share apps simon adin jconf adin jconf Benutzer appdata kde share apps simon adin jc kde share apps simon adin j onf conf julius jconf Template Installationspfad share apps s kde4 config imond default jconf prefix share apps simond def ault jconf julius jconf Benutzer appdata kde share apps simond mod kde share apps simond mod els els Benutzer active julius jconf Benutzer active julius jconf 109 Chapter 5 Fragen und Antworten Um diese Sektion immer aktuell zu halten wird dieser Teil des Handbuches in unserem online Wiki http www cyber byte at wiki index php English Troubleshooting und somit f r alle editierbar verwaltet 110 Chapter 6 Danksagungen und Lizenz simon Programm Copyright 2006 2009 Peter Grasch lt grasch simon listens org gt Phillip Goriup Tschernegg Susanne Bettina Sturmann Martin Gigerl Dokumentation Copyright c 2009 Peter Grasch lt grasch simon listens org gt bersetzung Copyright c 2009 Peter Grasc
59. ionen durch die Haupt Werkzeugleiste Es existieren 9 Aktionen in der Toolbar e s mond Verbindung Dieses Men objekt hat verschiedene Zust de Verbinden Wenn simon nicht zum simond verbunden ist ist die Option mit Verbinden beschriftet Wenn die Option aktiviert wird wird simon eine Verbindung zum simond aufbauen und die Option wechselt in den Verbinde Status Wenn dies das erste Mal ist das eine Verbindung zum simond Server aufgebaut wird kann es sein dass simon Sie nach einem Benutzername und einem Passwort fragt Wenn Sie noch keinen simond 19 Chapter 4 simon benutzen Benutzer angelegt haben sollten Sie das jetzt machen sehen Sie das simond Handbuch help simond f r Details bevor Sie fortfahren Haben Sie bereits einen Benutzer in simond angelegt geben Sie seine Daten bitte in das Anmeldefenster ein Wenn Sie ausw hlen das Passwort zu speichern wird Sie simon beim n chsten Verbindungsaufbau nicht mehr nach den Anmeldedaten fragen Sie k nnen sie aber nat rlich jederzeit in der Server Konfiguration dern Verbinde Wenn simon gerade eine Verbindung zum simond aufbaut adert sich der Text in Verbinde und der Knopf ist heruntergedr ckt Wenn die Option dann ausgew hlt wird wird der Verbindungsaufbau abgebrochen und die Option wechselt zur ck in den Verbinden Status Aktivieren Wenn simon eine Verbindung mit einem s mond hergestellt hat wird sich der Text in Aktivieren dern und wird nich
60. it simon erstellte Aufnahmen angewandt werden soll oder nur f r Sprachdaten die mit der Funktion Trainingsdaten importieren importiert wurden Eine Beispielanwendung f r Nachbearbeitungsketten w re das Resampling von Aufnahmen auf Grund von Hardwareeinschr kungen Nehmen wir eine Soundkarte an die keine 16kHz mono Aufnahmen unterst tzt sondern nur 44100Hz stereo CD Aufnahmen k nnen wir das freie Kommandozeilentool SoX http sox sourceforge net verwenden um die Aufnahmen automatisch auf ein entsprechendes Format zu resampeln Dieses Beispiel w rde das folgende Nachbearbeitungskommando verwenden ees c 1 r 16000 al 2 Mit diesem Kommando k nnen wir jetzt ohne Probleme mit 44100Hz und 2 Kan len aufnehmen wenn die Option gesetzt ist die Filter auch f r Aufnahmen in simon anzuwenden weil simon dann die Aufgenommenen Dateien automatisch in brauchbare 16kHz mono Aufnahmen umwandeln wird wenn die Aufnahme abgeschlossen wird Sprachmodell Hier k nnen Sie die Parameter des Sprachmodells anpassen d G Einrichten simon 2 ei x Konfiguration des Sprachmodells von simon MA Allgemein Ss Aufnahmen Trainingsdaten Sample Rate 16000 Hz Pfad zu den Trainingssamples 1e bedahr kde4 share apps simon model training data i 4 Sprachmodell Modell Einstellungen Erkennung if ei Aktionen Ser Social Desktop Hilfe ts Voreinstellungen Zur cksetzen OK gei Anwenden Abbrechen Die Samp
61. ken warten Wenn Sie also bspw 52 eingeben wollten w rden Sie folgendes sagen F nf Pause Zwei Weil die Pause ben tigt w rd um den Satz zu beenden w rde eine zeitgesteuerte Anwendung die Eingabe von F nf als bereits vollst dig interpretieren Das Nummer eingeben Plug In wenn ausgel st zeigt eine Taschenrechner hnliche Oberfl che um eine Zahl einzugeben Die Eingabe kann jederzeit korrigiert werden indem der Benutzer Zur ck sagt Ein Dezimal Komma kann eingef gt werden indem der Benutzer Komma sagt Wenn Ok gesagt wird wird die Zahl eingetippt Da die tats chliche Eingabe innerhalb des Plug Ins stattfindet erh lt die Applikation schlussendlich nur noch eine Serie von schnell hintereinander simulierten Tastendr cken die nur noch Millisekunden auseinanderliegen E A simon 2 e ie x SS a SEE 3 4 3 6 i 3 W i Zur ck Ok Abbrechen Wahrend das Nummer eingeben Plug In aktiv ist es wird angezeigt wird jedes Erkennungsergebnis das nicht da Nummer eingeben Plug In selbst betrifft andere Kommandos etc verworfen Die Eingabe kann jederzeit abgebrochen werden durch sagen von Abbrechen oder durch klicken auf das Abbrechen Feld Weil keine Kommandos vom Typ Nummer eingeben angelegt werden k nnen ist dieses Plug In auch nicht im Neues Kommando Dialog aufgef hrt Das Nummer eingeben Plug In registriert aber eine Konfigurationsseite in der Kommandokonfiguration 84 ZS vu S Eins f zwei ZS
62. ktopgitter Zur ck Cancel Dieses Pup kann ber die Option Auswahlliste anzeigen fur ungenaue Ergebnisse kontrolliert werden Plug In Basisschriftart Einige Plug Ins von simon haben eine grafische Oberfl che Die Schriftarten dieser Oberfl chen k nnen hier zentral konfiguriert werden unabh gig von den Systemschriftarten Ihres Betriebssystems 107 Chapter 4 simon benutzen Ki CG simon lt 2 gt D G G x Loch Jr in E E IAM ON IND O ZURUCK OK ABBRECHEN Listen Hier finden Sie die globale Listenkonfiguration Diese fungiert als Vorlage f r neue Szenarios aber wird auch direkt verwendet f r das Auswahlfenster f r mehrdeutige Erkennungsergebnisse Sozialer Desktop Szenarios k nnen hochgeladen und heruntergeladen werden mt simon Daf r verwenden wir KDEs soziale Desktop F higkeiten und unsere eigene Kategorie f r simon Szenarios auf kde files org http kde files org index php xcontentmode 692 Wenn Sie bereits einen Account auf opendesktop org http opendesktop org besitzen k nnen Sie die Anmeldedaten hier angeben Ansonsten k nnen Sie direkt im Konfigurationsmodul auch einen neuen Account anlegen Die Registrierung ist nat rlich kostenlos Aufnahmeparameter manuell anpassen simon ist auf Endbenutzer ausgelegt Das Benutzerinterface ist darauf ausgelegt es sogar Endbenutzern ohne Hintergrund n Spracherkennung zu erm glichen eigene Sprach und Akustikmodelle zu desig
63. lerate die hier gesetzt wird ist die Ziel Samplerate des Akustikmodells Sie hat nichts damit zu tun in welcher Samplerate die Sprachdaten von simon aufgenommen werden Es liegt in der 102 Verantwortung des Benutzers dass die Sprachdaten schlussendlich f r die Generierung des Modells auch in diesem Format vorliegen Normalerweise wird das einfach erreicht indem die Werte gleichgesetzt werden Sollte dies nicht m glich sein kann mit den Nachbearbeitungsketten nachgeholfen werden Sehen Sie die Sektion Aufnahmen f r mehr Details In den meisten F llen werden entweder 16kHz oder 8kHz Modelle verwendet 16kHz Modelle haben eine bessere Erkennungsrate als 8kHz Modelle und 8kHz Modelle sind weniger aufw dig weniger Prozessor lastig als 16kHz Modelle Modelle mit mehr als 16kHz werden nicht empfohlen weil Sie sehr CPU intensiv werden und in der Praxis kaum eine bessere Erkennungsrate erzielen Hier kann au erdem der Pfad zu den Trainingsdaten ge dert werden Sie m ssen allerdings selbst sicherstellen dass die bisher gesammelten Sprachaufnahmen auch in das neue Ziel verschoben werden Alternativ w rde simond die bereits synchronisierten Daten aus seiner Kopie wiederherstellen Ein manuelles verschieben zum neuen Speicherort ist also nicht zwingend notwendig solange zuvor synchronisiert wird aber es ist empfohlen Modellkonfiguration Allgemein Bitte sehen Sie die Basismodell Sektion Erweiterungen Hier k nnen Sie die Basis URL kon
64. ltigt z B Wei Karl wie man Programme startet und Hans we wie Ordner ge ffnet werden etc Wenn simon jetzt etwas erkennt wird dieses Erkennungsergebnis zuerst an Karl bergeben der sich das einmal ansieht Ist die Anweisung f r hn gedacht handelt er danach und startet in diesem Beispiel ein Programm Ansonsten gibt er die Anweisung weiter an Hans usw Wenn keiner der geladenen Plug Ins wei was zu tun ist wird das Erkennungsergebnis verworfen Die Abfolge in der das Erkennungsergebnis zu den einzelnen Plug Ins bergeben wird ist konfigurierbar in der Kommandokonfiguration Kommandos gt Plug Ins verwalten 67 Chapter 4 simon benutzen di e Aktionen verwalten simon gl el Ve d A Allgemein Listen Allgemein Ausl ser 3 F r alle Plug Ins anwenden Ee SC Programm Computer se Hinzuf gen Desktopgitter JB Text Makro Computer L schen J Tastenk rzel Computer 4 Hinauf T7 Desktopgitter Runter Liste Computer Kombination Computer E ort Computer Jedes Plug In kann mit einem Ausl ser verbunden werden Mit Ausl sern kann die Verantwortung der einzelnen Plug Ins besser aufgeteilt werden Wenn wir wieder zu unseren Fabrikarbeitern zur ckgehen k nnten wir es vergleichen mit dem expliziten sagen des Namens der zust digen Person Statt ffne meine eigenen Dateien sagen wir jetzt Hans ffne meine eigenen Dateien und Hans das Plug In das zust dig ist f r das ffnen der
65. ltwert von einem Kanal und einer Samplerate von 16kHz sind normalerweise korrekt und m ssen nicht ge dert werden Die Erkennung funktioniert nur mit mono Aufnahmen und funktioniert besser mit 16kHz Aufnahmen 8kHz w re die Alternative Allerdings gibt es einige billige Audioadapter die diesen speziellen Aufnahmemodus m glicherweise nicht unterst tzen In diesem Fall kann simon mit Nachbearbeitungsketten und Software von Drittanbietern um diese Limitation herumarbeiten Sehen Sie die Nachbearbeitungssektion f r mehr Informationen Grunds tzlich gilt ndern Sie die Kan le und die Samplerate nur wenn Sie sich sicher sind was Sie tun Sonst wird die Erkennung h chst wahrscheinlich n cht funktionieren d V Einrichten simon 2 Lei Le CH Konfiguration des Soundsystems von simon News is Ger tekonfiguration Voice Activity Detection Training amp Nachbear lt gt Y Eingabe 4 Wiedergabegerat Aufnahmen Ger t default CARD Intel w Sprachmodell Kan le 1 A ol Sample Rate 16000 Hz a Modell Benutzt f r Training Erkennung Einstellungen 3 a Test Erkennung Aktionen CX Social Desktop dr Ger t hinzuf gen Ger teliste aktualisieren Hilfe t Voreinstellungen Zur cksetzen _ W OK se Anwenden Abbrechen Verwenden Sie die Auswahllisten um die Ger te auszuw hlen Mit dem Knopf Aktualisieren k nnen Sie simon veranlassen erneut nach Ger ten zu suchen Sie k nnen simon mit m
66. mand 2 __ Build sentences Add to Training Remove Word from Training Import Dictionary C3 Clear 4 Edit Word Remove Word Sr Train selected Words Connected but Deactivated Compiling model 100 _ 4 Details Standardm ig wird das aktive Vokabular angezeigt Um das Schattenvokabular anzuzeigen w hlen Sie die Registerkarte Schattenvokabular F r jedes Wort wird eine Erkennungsrate angezeigt Die Erkennungsrate zeigt an wie oft ein Wort aufgenommen wurde alleine oder zusammen mit anderen W rtern Wenn diese Nummer nur Null oder Eins ist wird der Eintrag in der Wortliste rot markiert 1 Hellrot 0 Dunkelrot Das ist eine Warnung Wenn ein Wort eine Phonemkombination beinhaltet welche nie trainiert wurde Erkennungrate 0 kann das Modell nicht kompiliert werden Allerdings wird simon einen entsprechende Fehlermeldung anzeigen sollte dieses Problem eintreten Allgemein ist es eine gute Idee jedes Wort mindestens ein oder zweimal aufzunehmen am besten w hren das Wort hinzugef gt wird um diesen Problem grunds tzlich aus dem Weg zu gehen 38 Filter o O i emoon tan en Joen tan en Joen tan en a Je aeb asam mem Jemen engen en emm athena innen TING menam ren nn 4 gt Worter hinzufugen Um neue W rter zum aktiven Vokabular hinzuzuf gen benutzen Sie bitte den Wort Hinzuf gen Assistenten W rter hinzuzuf gen besteht 1m Prinzip aus zwei Schritten e Das Wort definieren Initiales
67. n Vokabular Grammatik Trainingstexte e Kommandos Szenarios decken nur das Sprachmodell language model des Erkennungssystem ab das Akustikmodell acoustic model ist dabei vollkommen unabh gig In den meisten F llen sind Szenarios so entwickelt um optimal mit einem gewissen Basismodell zusammenzuarbeiten um Probleme mit dem Phonemset zu vermeiden Weil Szenarios nicht direkt an ein Akustikmodell gebunden sind k nnen Sie weitergegeben werden und ohne Probleme mit anderen simon Anwendern ausgetauscht werden Um diesen Anwendungsfall m glichst gut abzubilden wurde eine Kategorie f r simon Szenarios auf kde files org http kde files org index php xcontentmode 692 eingerichtet Dort k nnen Szenarios die intern simple Textdateien im XML Format sind komfortabel hoch und heruntergeladen werden F r Informationen wie Sie Szenarios in simon verwenden k nnen sehen Sie bitte die Szenario Sektion im simon Verwenden Kapitel Basismodelle Basismodelle sind bereits generierte meist sprecherunabh gige Akustikmodelle die mit simon verwendet werden k nnen Mit Basismodellen kann ein Anwender die ben tigte Zeit f r ein individuelles Training stark reduzieren Bei Verwendung von statischen Basismodellen siehe unten ist eine Installation des HTKs nicht notwendig Bas smodelle die von simon verwendet werden k nnen bestehen aus vier Dateien die Sie in einem Archiv finden werden wenn Sie die Modelle von der jeweiligen Web
68. n auf eine Antwort der Gegenstelle wartet Wenn Sie eine sehr sehr langsame Netzwerkverbindung besitzen und oder die Beim simon Start automatisch verbinden Option verwenden und einen sehr langsamen Rechner verwenden erh hen Sie diese Option wenn Sie Timeout Fehler beim Verbinden mit dem simond Server erhalten die durch erneutes Aufbauen der Verbindung behoben werden k nnen simon unterst tzt Konfigurationen bei denen mehr als ein simond angegeben wird Das kann verwendet werden wenn Sie bspw einen Laptop besitzen der unterschiedliche Server verwendet wenn er zu Hause oder bei der Arbeit verwendet wird In diesem Fall k nnen S e beide Server hier angeben Wenn simon verbindet wird er die hier konfigurierten Server der Reihe nach durchprobieren bis er einen Server findet der auf seine Anfrage im gesetzten Timeout antwortet Um einen Server hinzuzuf gen geben Sie einfach seinen Hostnamen oder IP und den Port mit getrennt ein oder verwenden Sie den Dialog der erscheint wenn Sie den blauen Pfeil neben dem Eingabefeld anklicken und w hlen S e Hinzuf gen Synchronisation und Modell Backup Hier k nnen Sie die Modellsynchronisation konfigurieren und wenn n tig ltere Versionen Ihres Sprachmodells wiederherstellen 105 Chapter 4 simon benutzen En di amp Einrichten simon ae el e d Lal Erkennungskonfiguration SES Server Synchronisation e Synchronisierungsmodus Nur manuelle Synchronisation w Aufnahmen Verf
69. n ein mit der eben jener Text der von den Probanden vorgelesen werden muss gr er als der restliche Programmtext gemacht werden kann ohne den Rest des Programmes zu beeinflussen Dies half au erdem um die Aufmerksamkeit direkt auf den vorzulesenden Text zu lenken Hier k nnen Sie auch das ben tigte Signal Rauschverh ltnis einstellen das erreicht werden muss damit eine Aufnahme von s mon als korrekt angesehen wird Sehen S e die Aufnahme Qualit tskontrolle Sektion f r mehr Details 100 Auf dieser Konfigurationsseite k nnen Sie auch die Paramter f r die Lautst rkeeinpegelung festlegen S e kann sowohl f r den Wort hinzuf gen Dialog als auch f r den Trainingsassistenten deaktiviert werden indem das Konfigurationsfeld deselektiert wird Solange die aktuelle Aufnahmelautstarke unter der konfigurierten Minimumlautst rke bleibt wird der Anwender aufgefordert die Lautst rke zu erh hen Erreicht die Aufnahme die Maximallautst rke auch nur einmal wird simon Sie bitten die Lautst rke des Mikrofons zu verringern Ubersteuern erreichen der Maximallautst rke wird immer eine zu laut Warnung erzeugen Der angezeigte Text kann konfiguriert werden indem Text im Eingabefeld eingetragen wird Bleibt das Feld leer Standard wird ein Standardtext verwendet Nachbearbeitung Alle aufgenommenen Sprachdaten Training und importierte Aufnahmen mithilfe der Funktion Trainingsdaten importieren k nnen mit einer Reihe von Nachbearbeit
70. nderungen in simon zu kontaktieren die das Szenariosystem betreffen Fanmail etc 30 Wenn Sie keine Kontaktinformation hinterlegen wollen geben Sie einfach einen Strich ein Szenario editieren Um Szenarios zu editieren w hlen Sie Bearbeiten vom Szenarios verwalten Dialog Der Dialog funktioniert exakt gleich wie der Szenario hinzuf gen Dialog Szenario entfernen Um ein Szenario zu l schen w hlen Sie das Szenario aus der Liste und klicken Sie den L schen Knopf Weil Szenarios mit dem Erkennungsdienst synchronisiert werden k nnen Sie zuvor gel schte Szenarios ber das Modell Synchronisationsbackup wiederherstellen Szenario importieren Szenarios k nnen von einer lokalen Textdatei simons XML Szenario Dateiformat importiert werden oder direkt aus dem Internet heruntergeladen werden Wenn Sie Szenarios herunterladen wird eine Liste der verf gbaren Szenarios von der simon Scenarios http kde files org index php xcontentmode 692 Sektion der OpenDesktop Seite KDE files org http kde files org heruntergeladen Neue Erweiterungen herunterladen simon u oy Je Vi simon Installation von Erweiterungen af DE VF XBMC Von bedahr Installieren This content is a GERMAN nennen scenario for simon As such the Details content is of course German URG Sortieren nach Are ebe e Neuheit 11x heruntergeladen DE VF Firefox _ Bewertung Von bedahr Deinstallieren ate This content is a GERMAN
71. nen indem viele Default Werte bereits beim ersten ffnen der Applikation festgelegt wurden In speziellen F llen zum Beispiel schwere Sprachst rungen kann es notwendig werden einige tiefgreifende Parameter anzupassen Deshalb respektiert simon auch die gesetzten Werte in den Konfigurationsdateien f r die Erkennung Diese Konfigurationsdateien k nnen nat rlich frei angepasst 108 werden als w rde man direkt mit Julius arbeiten Es gibt zwei Teile der Julius Konfiguration die angepasst werden k nnen e adin jconf Das ist die Konfiguration die den Soundstream vom simon Client zum simond server steuert Die Datei wird direkt vom adinstreamer gelesen simon liefert eine Defaultdatei aus ohne spezielle Parameter Sie k nnen die Systemweite Konfiguration anpassen die alle Benutzer betrifft wenn Sie mehr als einen simon Benutzer auf Ihrem physischen System haben Wenn Sie die Konfiguration nur fur einen speziellen Benutzer anpassen wollen kopieren Sie die Konfiguration zum Benutzerpfad und passen Sie die Kopie an e julius jconf Das ist die Konfiguration vom simond Server die direkt die Erkennung beeinflusst Die Datei wird direkt von libjulius und libsent gelesen simond wird auch mit einer Default julius jconf ausgeliefert Immer wenn ein neuer Benutzer zur simond Datenbank hinzugef gt wird wird simond automatisch eine Kopie der Systemweiten julius jconf anlegen und sie in den Ordner des neuen Benutzers kopieren Sie k nnen die e
72. ningssitzungen von anderen Szenarios aufgenommen wurden entfernt wenn Sie dieses Wort beinhalten Verwenden Sie diese Funktion vorsichtig Spezialtraining Bitte sehen Sie die Sektion Spezialtraining im Trainingskapitel W rterbuch Importieren simon bietet die M glichkeit gro e W rterb cher als Nachschlagewerk zu importieren Dieses Nachschlagewerk wird Schattenlexikon genannt Wenn der Benutzer ein neues Wort hinzuf gt muss er die folgenden Charakteristika des Wortes angeben e Wortname e Terminal e Phonetische Transkription Diese Charakteristika werden automatisch aus dem Schattenlexikon genommen wenn das Schattenlexikon ein Wort mit dem selben Wortnamen f hrt Ein gro es hochqualitatives Schattenlexikon kann deshalb sehr hilfreich sein beim Hinzuf gen neuer W rter weil der Benutzer sich in den meisten F llen kaum mit den Details wie dem Phonemset auseinander setzen muss 48 x d A Importiere W rterbuch 21 Lei W rterbuch importieren Dieser Assistent wird Ihnen dabei helfen ein neues W rterbuch zu importieren Wilkommen Typ ausw hlen Datei wahl Ein W rterbuch beinhaltet Informationen ber die bekannten Datel w hlen W rter wie zum Beispiel wie Sie geschrieben werden und wie herunterladen sie ausgesprochen werden Importiere Das W rterbuch ist deshalb ein wichtiger Bestandteil von Fertig simon Wir empfehlen das HADIFIX BOMP W rterbuch aufgrund dessen hohen Qualit tsstandards
73. nsparenz verwendet werden Wenn das Desktopgitter konfiguriert wurde echte Transparenz zu verwenden und das System unterst tzt keine Compositing Effekte wird der Hintergrund des Gitters undurchsichtig und grau sein Beinahe alle aktuellen Systeme werden aber Compositing per Default unterst tzen Das beinhaltet zum Beispiel e Microsoft Windows 2000 oder h her XP Vista 7 e GNU Linux mit einem Composite Manager wie Compiz K Win4 xcompgrc etc Standardm ig verwendet das Desktopgitter nummern um die individuellen Felder auszuwahlen Um das Desktopgitter zu benutzen stellen Sie sicher dass Ihr Sprachmodell folgende S tze erm glicht e Eins e Zwei e Drei e Vier e F nf e Sechs 52 e Sieben 7 Acht e Neun e Abbrechen Um diese Ausl ser zu konfigurieren ver dern Sie einfach die Kommandos die mit dem Plugin assoziiert sind d ZS simon 3 G x Datei Szenarios Erkennung Module Kommandos Aktionen Einstellungen Hilfe Or y El u Q c DE Demo v i Aktivieren Wort Hinzuf gen Vokabular Grammatik Training Kommandos Synchronisieren 7 Willkommen 7 Kommandos U wortliste F ter F ter Eins Ce ee Programm bf Desktopgitter SS A J Tastenkurzel W Zwei Eins U Desktopgitter k Drei z Liste i Vier Beschreibung Klickt 1 Kombination Wg F nf Icon anzeigen Nein Sichtbarer Trigger 1 Wi Sechs LJ Sieben Ausl ser Acht Ee Si Zahl eingeben bi Neun
74. r besteht aus mehreren Registerkarten mit jeweils anderen Tasten Die Gesamtheit von Registerkarten und Tasten sind in Sets gesammelt Sie k nnen das zu verwendende Set in der Konfiguration ausw hlen oder neue anlegen 93 Chapter 4 simon benutzen Aktionen verwalten simon w ec es 2 Tastatur Allgemein zw Zahlenblock anzeigen Gro Kleinschreibung beachten WEEN ER Set _QWERTZ w gt Hinzuf gen Bearbeiten L schen Tab Keys w d r Hinzuf gen 4 Bearbeiten L schen Diktation 4 Hinauf WwW Runter Name Ausl ser Typ Wert 4P Hinzuf gen Q Q Text f Bearbeiten Fa gd A a W W Text meee Tastatur fa L schen E E Text AA Hinauf R R Text WwW Runter T T Text T Tract we ew OK Tasten sind in der Regel mit genau einem Zeichen verbunden k nnen aber auch l gere Texte und sogar Tastenk rzel beinhalten Deshalb k nnen Tastatursets auch spezielle Tasten wie Alle ausw hlen oder Passwort hinschreiben besitzen Neben den Registerkarten die die Tasten aufnehmen kann die Tastatur einige spezielle Tasten wie Steuerung Shift etc anzeigen Diese Tasten sind als Spracheingabekommandos realisiert und werden unabh gig von der ausgew hlten Registerkarte angezeigt Wie alle Spracheingabekommandos k nnen die Kn pfe versteckt werden indem alle assoziierten Sprachkommandos entfernt werden Die Tastatur bietet au erdem einen Nummernblock der angeze
75. r verwendet sobald das Wort wieder zu Ihrem aktiven Vokabular hinzugef gt wird _ Wort l schen assozierte Sprachdaten erhalten Das Wort wird sowohl vom aktiven als auch vom Schattenvokabular entfernt Alle assoziierten Sprachdaten werden aufbehalten und wiederverwendet wenn Sie das Wort erneut hinzuf gen Das wird das Wort vom aktiven und vom Schattenvokabular entfernen Alle assoziierten Sprachdaten werden ebenfalls gel scht Warnung simon wird alle Sprachdaten auch anderer W rter mit dem selben Namen entfernen sogar von anderen Szenarios eo GO Abbrechen Wie Sie sehen bietet der Dialog vier Auswahlm glichkeiten Das Wort zum Terminal Unbenutzt verschieben Weil Sie hoffentlich den Terminal Unbenutzt in Ihrer Grammatik nicht verwenden werden W rter die so markiert sind nicht l ger f r die Erkennung verwenden S e werden vom aktiven Vokabular entfernt bevor das Modell erstellt wird weil keine Grammatikstruktur sie mehr referenziert Wenn Sie den Terminal Unbenutzt in Ihrer Grammatik verwenden wollen k nnen Sie nat rlich einen anderen Terminal f r unbenutzte W rter verwenden Sie k nnen den Terminal ber den Wort editieren Dialog setzen Um das Wort erneut zu verwenden setzen S e es einfach weder auf den richtigen Terminal Assoziierte Trainingsdaten bleiben erhalten e Entferne das Wort vom aktiven Vokabular Diese Option wird das ausgew hlte Wort vom aktiven Lexikon und damit von der Erkennung
76. rafische Warteanzeige w hrend dem Training Diese Nachricht wird den Benutzer bitte eine Sekunde zu warten Willkommen Lautst rke Texte vorlesen Fertig I OXYGENTIMES XBMC at xy a XBMC Seite 1 von 14 Bitte nehmen Sie den unten angef hrten Text jetzt auf Tipp Lassen Sie am besten vor und nach dem Gesprochenen ca 1 bis 2 Sekunden Pause f r beste Ergebnisse Starte Medien a Aufnehmen Alle l schen Bitte warten 00 00 00 14 JL ei Abspielen L schen Zur ck Weiter gt Abbrechen bevor er gebeten wird zu sprechen 16 Chapter 3 Richtlinien Pi LS XBMC ay Lac Ed XBMC Seite 1 von 14 Bitte nehmen Sie den unten angef hrten Text jetzt auf Wilkommen g i Lautst rke Tipp Lassen 5ie am besten vor und nach dem i Gesprochenen ca 1 bis 2 Sekunden Pause fur beste Texte vorlesen Ergebnisse Ferg Starte Medien OAXTGENTIMES Aufnehmen Alle l schen Bitte sprechen 00 00 01 72 ei Abspielen L schen Zur ck Weiter gt Abbrechen Diese Methode des visuellen Feedbacks hat sich als besonders wertvoll erwiesen wenn mit Personen aufgenommen wird die den angezeigten text nicht selbst lesen k nnen und deshalb auf Moderatoren angewiesen sind die Ihnen sagen was Sie sprechen sollen Die farbige Anzeige hilft Ihnen zu erkennen
77. rden kann m ssen Sie aber auch hier alle W rter zum aktiven Lexikon hinzuf gen siehe oben Trainingsdaten importieren Mit der Trainingsdaten importieren Funktion k nnen Sie zuvor gesammelte Trainingsdaten von fr heren Versionen von simon importieren ohne das komplette W rterbuch mitzu bernehmen Diese Funktion ist sehr speziell Bitte benutzen Sie sie nur wenn Sie sich sicher sind dass Sie wissen was Sie tun Sie konnen entweder seperate Promptsdateien angeben oder simon die Transkription aus den Dateinamen ablesen lassen Wenn Sie prompts basierte Transkriptionen verwenden UTF 8 enkodiert muss die Eingabedatei den folgenden inhalt besitzen Dateiname Inhalt Dateinamen sind ohne Dateiwereiterung anzugeben und der Inhalt besteht nur aus Gro buchstaben Zum Beispiel Die Zeiele demo 2007 03 20 DEMO bedeutet dass die datei demo 2007 03 20 wav den Inhalt Demo besitzt 65 Chapter 4 simon benutzen Weil Promptsdateien keine Dateierweiterung besitzen wird simon wav mp3 ogg und flac probieren in dieser Reihenfolge Sollte eine Datei mit einem solchen Dateinamen existieren wird diese Datei importiert und folgende bereinstimmung ignoriert sollten demo wav und demo mp3 existieren wird nur die demo wav importiert Dies ist im Gegensatz zu Dateibasierten Transkriptionen wo beide Dateien importiert werden w rden Wenn dateibasierte Transkriptionen verwendet werden wird der Assistent die Transkription aus den gefund
78. ription manuell angeben Die Aussprache ist etwas komplizierter simon ben tigt zwar keine bestimmten Lautschriftstandard solange er nur aus Buchstaben keine Zahlen und Sonderzeichen besteht Allerdings ist es empfehlenswert die Lautschrift und das Phonemset des Schattenlexikons zu bernehmen Wenn Sie nicht wissen wie ein Wort transkripiert wird k nnen Sie das die Informationen aus dem Schattenlexikon verwenden sogar wenn das Wort dort nicht vorkommt Wenn wir zum Beispiel das Wort Firefox hinzuf gen wollen um den Webbrowser Firefox zu starten ist dieses Wort hochstwahrscheinlich nicht in unserem Schattenlexikon vorhanden Ich verwende das HADIFIX BOMP als mein Schattenlexikon Firefox ist nicht in unserem Schattenlexikon enthalten Deshalb schl gt simon keine Werte vor d V Wort Hinzuf gen SES ei Definiere Wort Willkommen Wort Wort definieren Terminal ADD v e _Lautstarke Training 1 2 Training 2 2 Fertig Wort Betonung Typ Erkennungsrate Aussprache hnliche W rter Beispiele hnliche w rter inkludieren Ale w rter die den Suchstring beinhalten inkludieren lt Zur ck Weiter gt Abbrechen Wir wissen aber dass das Wort Firefox gleich ausgesprochen wird wie die W rter Feier Fest und Fox Tanz welche beide im BOMP Lexikon vorkommen ffnen wir also das Vokabular Sie k nnen den Assistenten offen lassen indem S e Vokabular
79. s Bones Ee een ee Chapter 1 Einleitung simon ist das Haupt Frontend zu der simon Open Source Spracherkennungsl sung Es ist ein simond Client und bietet ein grafisches Interface um das Sprachmodell und die Kommandos zu verwalten Au erdem kann simon mit einer Vielzahl von Kommandos auf das Erkennungsergebnis reagieren das er vom Server simond erh lt Im Gegensatz zu existierenden kommerzieller Software bietet simon einen einzigartigen do it yourself Ansatz f r Spracherkennung Statt vordefinierten bereits trainierten Sprachmodellen wird simon mit keinem Sprachmodell ausgeliefert Stattdessen bietet es eine einfache Benutzeroberfl che f r Endbenutzer um das Sprach und Akustikmodell selbst zu erstellen Zus tzlich kann der Endbenutzer die Anwendungsf lle von anderen Benutzern einfach herunterladen und seine eigenen einfach mit anderen Benutzer austauschen Die aktuelle Version kann dazu benutzt werden um Command amp Control L sungen zu verwirklichen die besonders bei der k rperlich eingeschr kte Zielgruppe Anwendungen finden d rfte Eine freie Diktation ist aufgrund der gro en Menge an daf r notwendigen Trainingsdaten in der derzeitigen Version n cht vorgesehen Wegen s mons Architektur kann die selbe Version f r alle Sprachen und Dialekte verwendet werden Der Benutzer kann sogar verschiedene Sprachen innerhalb eines Modells mixen sollte dies gew nscht sein Chapter 2 bersicht Architektur Die Erkennungsarchit
80. s wird Synchronisation genannt Per Default wird simon eine Synchronisation 20 automatisch einleiten wenn er sich zum Server verbindet und jedes Mal wenn sich die Eingabedateien f r das Sprachmodell lokal dern Bitte sehen Sie die Sektion Synchronisation konfigurieren wenn Sie diese Einstellung dern wollen Mit dieser Men option k nnen Sie die Synchronisation jederzeit manuell ausl sen Szenario Auswahl Dieses Auswahlfeld erlaubt Ihnen das derzeit angezeigte Szenario anzupassen Jede Untersektion Vokabular Grammatik Kommandos Training wird dann das ausgew hlte Szenario anzeigen Das hier ausgew hlte Szenario beeinflusst die Erkennung nicht e Szenarios verwalten Anzeigen des Szenarios verwalten Dialog Hier k nnen Sie Szenarios verwalten und die verf gbaren Optionen der Szenario Auswahlbox anpassen Das simon Hauptfenster kann jederzeit versteckt werden indem man auf das simon Logo im Systemabschnitt der Taskleiste normalerweise der Bereich neben der Uhr klickt Wird das Symbol erneut gedr ckt wird simon wieder angezeigt Ben tigte Resourcen fur eine Funktionierende simon Konfiguration Note F r mehr Information ber Sprachmodelle sehen Sie bitte die Sektion Spracherkennung Hintergrund im bersichtskapitel Damit die Spracherkennung funktioniert ben tigt simon ein Sprachmodell engl speech model Sprachmodelle speech models beschreiben wie Ihre Stimme klingt wie welche W rter klingen welche W
81. sche Transkription manuell angchen EE EE EE eher EE eA EE ee SIE EE EE eene Tele TOT nee E EH EE ee RR d e EE E Ee EE P EE Ee eege dE HEEN real E E Die Grammatik defhnieren EE WEE Terminale umbenennen etete rntn tereo n tarere renee rererere renaren erenn en neenon ennennennee Terminale verbunden I TEE SaLe e E KE eA E Trainingstexte hinzuf gen E E Ier a Sl EE Sera IE EE Traimningsdaten EE ee EE Ei a Pre ee E eiea E Tera aaea EE imporre eege ege EE ee Ee EE eltern nennen Tex Makro K Omar E EU E 0s nn EE Listen Euren Konfip raton EE euere Kombination K 0 oa a te IR e E EE E E be JENE EE Be E E Taschenrechner Filter Aussprachetraumng KE EE Allee nee EE Ger tckonhoeuratton Sprachaktivit tserkennung Trainingskonfiguration Nachbearbeitung EE en eos eee ee M dellkonhsnration auennuiseren E Erweterungen EE EE einen Netzwerk Synchronisation und Modell Backup AK EE EE eene eege Plug In Basisschouftart EC EE EE Deski p erranssa Aufnahmeparameter manuell anpassen 5 Fragen und Antworten ssssssssssssssssnsssnsnunsssesssnnnnnee 6 Danksagungen und Lizenz ssssssssssssssssnsssesssnnnnnee A Instala O cuisine List of Tables 2 1 Beispiels Vokabular euere nee einen ABI Ce pee 0 110 E e E E dE El EE 4 4 Verbessertes Beispielvokabular uuuceeieenunnnn ine 47 Juliu
82. seite herunterladen e hmmdefs e tiedlist e macros 11 e stats Die letzten beiden Dateien macros und stats sind nicht notwendig wenn Sie statische Basismodelle verwenden und k nnen in diesem Fall mit leeren Dateien ersetzt werden sollten Sie nicht verf gbar sein Wo bekommen Sie Basismodelle Um diese Liste aktuell zu halten sehen Sie bitte die Liste in unserem Wiki http www simon listens org wiki index php English Base models Where to get base models Verschiedene Typen von Basismodellen Es existieren drei typen von Basismodellen Statisches Basismodell Adaptiertes Basismodell Benutzergeneriertes Modell F r Informationen wie Sie Basismodelle mit simon verwenden k nnen sehen Sie bitte die Basismodelle verwenden Sektion im simon Verwenden Kapitel Statisches Basismodell Statische Modelle verwenden einfach ein zuvor kompiliertes Akustikmodell ohne es zu bearbeiten Trainingsdaten die mit simon aufgenommen werden werden nicht verwendet um die Erkennungsrate zu erhohen Dieser Typ von Modell benotigt kein HTK Adaptiertes Basismodell Durch Adaption von bereits kompilierten Akustikmodellen k nnen Sie die Erkennungsrate steigern indem S e das Modell an Ihre Stimme anpassen Gesammelte Trainingsdaten werden in eine Adaptionsmatrix kompiliert die dann auf das ausgew hlte Basismodell angewendet wird Dieser Typ von Modell ben tigt ein installiertes HTK Benutergeneriertes Modell Wenn Sie benut
83. t heruntergedr ckt sein Wenn die Option aktiviert wird was automatisch passiert wenn die Erkennung verf gbar ist und die Option Erkennung automatisch starten sobald verf gbar aktiviert ist wird simon versuchen die Erkennung zu starten Eine Option die Verbindung zum simond zu trennen Verbindung trennen ist verf gbar ber das kleine H kchen neben der Option Aktiviert Wenn s mon eine Verbindung zum Server aufgebaut hat und die Erkennung starten konnte wird die Option mit Aktiviert beschriftet und heruntergedr ckt sein Wenn die Option jetzt aktiviert wird wird simon die Erkennung stoppen und somit in den Aktivieren Status zur ckfallen Die Verbindung zum Server wird dadurch aber nicht getrennt Eine Option die Verbindung zum simond zu trennen Verbindung trennen ist verf gbar ber das kleine H kchen neben der Option Wort hinzuf gen Zeigt den Wort Hinzuf gen Assistenten an e Vokabular Zeigt das Vokabular an e Grammatik Zeigt die Grammatik an Training Zeigt das Training an e Kommandos Zeigt die Komamndos an Synchronisieren Wenn simon zum s mond verbunden ist ist diese Option verf gbar simon erstellt die Eingabedateien f r das Sprachmodell welche dann kompiliert und vom simond Server f r die Erkennung verwendet werden siehe auch das Kapitel Architektur f r mehr Details Der Prozess des sendens der Ausgabedaten kompilieren dieser und erhalten des fertigen Sprachmodell
84. t um den Punkt des loslassens auszuw hlen amp simo ei el E Nummer Kommando Doppelklick Rechtsklick Mittelklick Drag amp Drop W hrend das Desktopgitter aktiv ist es wird angezeigt wird jedes Erkennungsergebnis das nicht das K Chapter 4 simon benutzen Desktopgitter selbst betrifft andere Kommandos etc verworfen Der Auswahlprozess kann jederzeit abgebrochen werden durch sagen von Abbrechen Das Plug In Desktopgitter registriert eine Konfigurationsseite in der Kommandokonfiguration d V Aktionen verwalten simon 2 Lei Le x Desktopgitter 4 Li Allgemein wi Verwende echte Transparenz Ca SEN Aktion Desktopgitter Immer nachfragen _ Standard ohne nachfragen ausw hlen Diktation e Nachfragen aber w hle Standard wenn nach 12 00 A Sekunden Standardmodus Linksklick Ww Der Ausl ser der das Desktopgitter aktiviert anzeigt ist nat rlich frei konfigurierbar Au erdem kann der Benutzer zwischen echter und falscher Transparenz unterscheiden Wenn Ihre grafische Oberfl che Compositing Effekte erlaubt kann simon echte Transparenz verwenden Sollte echte Transparenz nicht m glich sein wird simon mit falscher Transparenz arbeiten Dabei schie t simon eine Momentaufnahme des aktuellen Bildschirmes bevor das Desktopgitter angezeigt wird und setzt dieses Bild als Hintergrundbild des Desktopgitters Wenn verf gbar sollte immer die echte Tra
85. tionsoptionen dieses Schritts in der Soundkonfiguration jederzeit dern Lautst rkeeinpegelung Damit simon korrekt funktioniert muss die Mikrofonlautst rke korrekt eingestellt sein 27 Chapter 4 simon benutzen simon gl Jee x Lautstarke Willk Bitte lesen Sie den Text w hrend Sie die Lautst rke des r IKOMMEN Mikrofons e mit dem System Mixer ndern bis simon anzeigt Genarios dass die Laust rke korrekt konfiguriert wurde Basismodelle Wenn Sie die Lautst rke ndern dr cken Sie bitten den Server Lautst rke ge ndert Knopf Audioger te Lautst rke Fertig Bitte sprechen Sie ein paar S tze Betonen Sie deutlich aber nat rlich und sprechen Sie in einer normalen Lautst rke Ger t Intel D Lautst rke erh hen Lautst rke ge ndert Zur ck Weiter gt Abbrechen F r mehr Information sehen Sie bitte die Lautst rkeeinpegelung Sektion und dasRichtlinien Kapitel Szenarios Diese Sektion beschreibt wie Sie Szenarios innerhalb von simon verwenden F r generelle Informationen ber Szenarios sehen Sie bitte das Hintergrund Kapitel Szenarios verwenden Beginnend mit simon 0 3 wird jedes Wort das hinzugef gt wird zum aktuell akt ven Szenario hinzugef gt Das selbe gilt f r Grammatikstrukturen Kommandos etc Szenarios zu verwenden ist dann gleichzusetzen mit dem normalen verwenden von simon wie Sie es vielleicht schon n 0 2 gemacht haben Standardm ig kommt s
86. triebssytem Benutzer auf dem System angezeigt und k nnen innerhalb von simon je nach Betriebssystemberechtigung h chstwahrscheinlich nicht gel scht werden Dieser Ordner eignet sich besonders gut f r Systemadministratoren die allen Benutzern ein gemeinsames Set an Trainingsdaten geben wollen Die XML Dateien eine f r jeden Text k nnen von einem Speicherort zum anderen verschoben werden Abhagig von den zugrunde liegenden Betriebssystemberechtigungen wird dies aber wahrscheinlich Administratorenrechte ben tigen Texte hinzuf gen Wilkommen Quelle wahlen Neu mportieren Arbete Fertig Der Trainingstexte hinzuf gen Assistent bietet einen einfachen Weg neue Texte zu simon hinzuzuf gen Wenn lokale Textdateien importiert werden wird simon automatisch versuchen einzelne S tze aufzuspalten um Sie beim Training eigenen Seiten Aufnahmen zuzuordnen Der Algor thmus behandelt zwischen normalen Satzzeichen 1 7 und Abs tzen als S tze Jeder Satz wird im Trainingstext auf einer Seite und somit auf einer eigenen Aufnahme sein simon unterst tzt zwei Quellen f r neue Trainingstexte 61 Chapter 4 simon benutzen Trainingstexte hinzuf gen Assistent Trainingstext hinzuf gen Wilkommen Quelle w hlen Neu Importieren Arbeite Fertig Testname home bedahr simontext txt Tragen Sie den Trainingstext einfach n das entsprechende
87. tzergeneriertes Modell 13 Chapter 3 Richtlinien Dieses Kapitel listet ein paar grundlegende Richtlinien die in unterschiedlichen Teilen von simon relevant sind Aufnahmen Wenn Sie benutzergenerierte oder adaptierte Modelle verwenden wird simon basierend auf transkripierten Sprachaufnahmen von der Stimme des Benutzers auf sein Akustikmodell aufbauen Deswegen ist die Qualit t der aufgenommenen Trainingsdaten entscheidend f r die Erkennungsrate Lautst rke Es ist wichtig dass Sie vor der Aufnahme die Lautst rke Ihres Mikrofons kontrollieren simon Kalibrierung Die aktuelle Version von simon inkludiert einen einfachen Weg um sicherzustellen dass die Lautst rke korrekt konfiguriert ist Wort Hinzuf gen Wilkommen Wort definieren Lautst rke Training 1 2 Training 2 2 Fertig Standardm ig wird die Lautst rkekalibrierung angezeigt bevor eine Aufnahme in simon startet 14 Chapter 3 Richtlinien Um die Lautst rke zu kalibrieren sprechen Sie einfach den angezeigten Text nach Um die Kalibrierung zu berwachen sehen Sie bitte die angezeigte Lautst rke und die Notiz darunter die sagt ob Sie die Lautst rke heben oder senken sollten Um die Lautst rke zu ver dern verwenden Sie bitte die Lautst rkekonfiguration Ihres Betriebssystems Sobald S e dort die Lautst rke ver dert haben dr cken Sie bitte in simon auf Lautst rke ge dert um die Kall brierung dar ber zu
88. ul sen Kommandos unterschiedlicher Typen k nnen in einer Liste gemischt werden Listen Kommandos Anzeige Wenn ein List Kommando ausgel st wird wird eine Liste in der Mitte des Bildschirmes angezeigt Diese Liste wird automatisch gr er und kleiner um alle Elemente anzeigen zu k nnen 76 Nummer Kommando 1 Mozilla Firefox 2 z Konqueror 3 amp Amarok 4 OpenOffice org 3 2 Writer 5 7 KWord P CH Kopete Cancel Der Benutzer kann dann die Kommandos ausl sen in dem er die Nummer sagt die mit dem Kommando verbunden ist dass er ausl sen m chte In diesem Beispiel Eins um Mozilla Firefox aufzurufen W hrend eine Liste aktiv ist sie wird angezeigt wird jedes Erkennungsergebnis das nicht die Liste selbst betrifft andere Kommandos etc verworfen Der Auswahlprozess kann jederzeit abgebrochen werden durch sagen von Abbrechen oder durch klicken auf das Abbrechen Feld Wenn mehr als 9 Kommandos mit der Liste assoziiert sind werden automatisch Weiter und Zur ck Elemente angezeigt die ebenfalls mit Nummern versehen sind Null wird mit Zur ck und Neun wird mit Weiter verbunden 77 Chapter 4 simon benutzen Startmen Nummer Kommando Ja Zur ck Mozilla Firefox ze konqueror Amarok H OpenOffice org 3 2 Writer Th KWord CH Kopete la kopete S Kopete Weiter Konfiguration von Listenelementen Standardm ig verwendet das Listenkommando die folgenden A
89. ular Won Teminl Aussprache ___ Aktives Vokabular Das Vokabular dass f r die Erkennung verwendet wird wird als aktives Vokabular bezeichnet Schattenlexikon Wie bereits gesagt sollte der Benutzer sein Vokabular so klein wie m glich zu halten Anderseits sollte es Informationen ber die Aussprache von m glichst vielen W rter beinhalten um das hinzuf gen neuer W rter zu erleichtern s mon bietet deshalb ein Referenzw rterbuch das Schattenlexikon genannt wird Das Schattenlexikon ist ein zweites Vokabular welches nicht f r die Erkennung verwendet wird Es kann mit fertigen W rterb chern gef llt werden Der Benutzer kann dann beim hinzuf gen von neuen W rtern von den Informationen aus dem Schattenlexikon profitieren Weil simon eine internationale L sung ist wird simon nicht mit einem Schattenlexikon ausgeliefert Allerdings ist es sehr einfach Lexika ber den W rterbuch Importieren Assistenten zu importieren Verwalten des Vokabulars simon bietet ein Vokabular Men welches das aktuelle Vokabular anzeigt 37 Chapter 4 simon benutzen Le simon ye x File Scenarios Recognition Module Commands Actions Settings Help v KN LE o 7 Demo v o Manage scenarios Activate Add Word Vocabulary Grammar Training Commands Synchronize 7 Welcome 7 Wordlist Train Words Active Vocabulary Shadow Vocabulary Vocabulary Filter Word A Pronunciation Category tecognition Rati Firefox fayerfaaks Com
90. ungsergebnis ja aber zu den anderen Plug Ins weitergegeben wird wird auch ein m gliches Firefox Kommando ausgef hrt und der Browser tats chlich gestartet Bitte beachten Sie dass dieses Plug In nur funktionieren wird wenn festival installiert und konfiguriert ist und in Ihrem Systempfad liegt Taschenrechner Das Taschenrechner Plug In ist ein simpler sprachgesteuerter Taschenrechner Ei simon lt gt D im Lex x 2 E 2 Plus Multiply PES 5 1 2 3 Minus Divide Percent Equals Vok JL Cancel 88 Der Taschenrechner erweitert das Nummer eingeben Plug In mit weiteren Funktionen Wenn das Plug In geladen wird wird eine Konfigurationsseite zum Plug Ins verwalten Dialog hinzugef gt Aktionen verwalten simon Allgemein Desktopgitter I Diktation Tastatur Taschenrechner Dort konnen Sie auch den Kontrollmodus des Taschenrechner konfigurieren Wird dieser auf etwas anderes als Voller Taschenrechner gesetzt werden Optionen ausgeblendet Die so versteckten Kontrollelemente k nnen aber im Gegensatz zu solchen bei denen einfach alle assoziierten Sprachkommandos gel scht wurden noch immer ber die Sprache ausgew hlt werden Wenn der Ok ausgew hlt wird wird der Taschenrechner standardm ig fragen was mit dem erzeugten Ergebnis gemacht werden soll Sie k nnen z B das Ergebnis der Rechnung die Rechnung selbst oder beides ausgeben Sie k nnen dies jedes mal von der Liste
91. ungskommandos bearbeitet werden Nachbearbeitungsketten sind eine fortgeschrittene Funktionalit t von simon die vom durchschnittlichen simon Anwender wohl nicht ben tigt werden d ZS Einrichten simon 3 Lei a x IL Konfiguration des Soundsystems von simon GC Allgemein Ss Aufnahmen tekonfiguration ei Voice Activity Detection Training Nachbearbeitung lt _ Filter auch f r Dateien anwenden die mit simon aufgenommen werden Nachbearbeitungs Filter Sprachmodell yy ul Eritf men Modell Einstellungen AA Nach oben Erkennung Hd er Aktionen CH Social Desktop Legende 1 Eingabedatei 2 Ausgabedatei Hilfe Voreinstellungen Zur cksetzen w OK e Anwenden Abbrechen Die Nachbearbeitungskommandos sind wie eine Serie von Filtern durch die die Aufnahmen durch m ssen Mit diesen Filtern k nnte man zum Beispiel Hintergrundrauschen entfernen oder die Aufnahmen normalisieren Nehmen wir als Beispiel ein Programm namens audio verarbeiten das die Eingabe und Ausgabedatei als Argumente nimmt z B audio verarbeiten 1 2 Die beiden Platzhalter 1 und 2 werden dann von simon bei jedem Aufruf mit den jeweiligen tats chlichen Werten f r den Eingabedateinamen 101 Chapter 4 simon benutzen und den Ausgabedateinamen respektive ersetzt Die Option Filter auch f r Dateien anwenden die mit simon aufgenommen werden definiert ob die konfigurierten Filter auch f r m
92. ur Sektion f r mehr Informationen Die Aufnahme Daten vom Mikrofon werden nicht die ganze Zeit an den Server gesendet sondern werden vom simon Client segmentiert Dies geschieht durch die sogenannte Sprachaktivitatserkennung 98 lt gt aana Speech Model gt lt gt ul Model Settings Recognition Actions Social Desktop Hier k nnen Sie die Segmentierung durch die folgenden Parameter beeinflussen Cutoff level Alles unter dieser Lautst rke wird als Stille behandelt Hintergrundger usch e Head margin Fur die Dauer von Head Margin werden Daten gesammelt bevor die aktuelle Aufnahme tatsachlich als Sprache klassifiziert wird W hrend dieser kompletten Zeit muss die Lautst rke ber dem Cutoff Level bleiben e Tail margin Nachdem die Lautst rke unter das Cutoff Level f llt wird simon die Zeit von Tail Margin abwarten bis er die aktuelle Aufnahme abschlie t e Aufnahmen berspringen die k rzer sind als Aufnahmen die k rzer als dieser Wert sind werden nicht an die Erkennung weitergegeben husten 99 Chapter 4 simon benutzen etc Trainingskonfiguration S AN e amp Einrichten simon ew Le x IL Konfiguration des Soundsystems von simon CC Allgemein Ger tekonfiguration Voice Activity Detection e Training Nachbear lt gt S Powertraining per Default Aufnahmen ee E agaeeo mMmM SS Schriftart Dejavu Sans 8 Ausw hlen Minimales Si
93. usl ser Um List Kommandos zu ihrem vollen Potential zu benutzen stellen Sie sicher dass Ihr Sprachmodell die folgenden Satze kennt und erlaubt e Null e Eins e Zwei e Drei e Vier e F nf e Sechs e Sieben e Acht e Neun e Abbrechen Nat rlich k nnen Sie diese W rter in der simon Konfiguration anpassen 78 e Kommandos gt Plug Ins verwalten gt Allgemein gt Listen f r die szenarioweite Listenkonfiguration Einstellungen gt simon einrichten gt Aktionen gt Listen f rdie globale Konfiguration When Sie ein neues Szenario anlegen wird diese Konfiguration als die Listenkonfiguration des neuen Szenarios bernommen Listenkommandos sind intern auch verwendet von anderen Plugins wie z B das Desktopgitter Die Konfiguration der Trigger beeinflusst auch deren Listen Kombination Kommandos Kombination Kommandos erlauben dem Benutzer mehrere Kommandos automatisch hintereinander ablaufen lassen Wenn ein Kombinationskommando ausgel st werden werden alle mit ihm assoziierten Kommandos in einer Reihenfolge die der Benutzer festlegt ausgef hrt Es k nnen auch Wartezeiten zwischen Kommando Aufrufen eingef gt werden 79 Chapter 4 simon benutzen ffnet kopete w hlt den Eintrag Mathias ffnet ein Chatfenster mit ihm und sendet Hi bevor beide Fenster wieder geschlossen werden Mit Kombination Kommandos kann der Benutzer komplexe Arbeitsabl ufe
94. ustikmodell beinhaltet Daten wie die einzelnen Phoneme und nicht ganze W rter vom Anwender ausgesprochen werden Das Trainingsmaterial eines Wortes beeinflusst deshalb auch die Erkennungsrate hnlicher Worte positiv Das bedeutet dass wenn zum obigen Beispielvokabular nun noch das Wort Mailing hinzugef gt wird wei das Akustikmodell bereits ungef hr wie es klingen wird weil das Wort aus den Phonemen m E I 1 I N besteht und wir die Phonemkombination m E I 1 ja bereits f r Mail trainiert haben Wird jetzt eines der beiden W rter trainiert verbessert sich die Erkennung beider 10 Chapter 2 bersicht W rter Nat rlich m ssen aber auch die Phoneme I und N trainiert werden weshalb ein alleiniges Training vom Wort Mail nicht ausreicht um Mailing zu erkennen Um das Akustikmodell zu trainieren in anderen Worten dem Computer zu erkl ren wie die Phoneme von Ihnen ausgesprochen werden m ssen W rter aus Ihrem Sprachmodell trainiert werden Das bedeutet dass simon das Wort anzeigt und Sie dieses laut vorlesen Weil simon das Wort aus seinem Vokabular bereits kennt wei er aus welchen Phonemen es besteht Damit kann er dann Ihre pers nliche Aussprache dieser Phoneme erlernen Szenarios Ein Szenario bestimmt einen kompletten Anwendungsfall von simon Um Firefox zu steuern zum beispiel kann man einfach das Firefox Szenario installieren Jedes Szenario beinhaltet die folgenden Komponente
95. zergenerierte Modelle verwenden ist der Benutzer daf r verantwortlich dass das Modell trainiert ist Es wird kein Basismodell verwendet Die Trainingsdaten werden verwendet um das eigene Akustikmodell zu kompilieren Dies erlaubt es ein System zu entwickeln das direkt Ihre eigene Sprache reflektiert Dieser Typ von Modell ben tigt ein installiertes HTK Phonemset Probleme Da der statistische Vergleich auf Phonemebene geschieht beschreibt das Basismodell wie diese Phoneme klingen 12 Chapter 2 bersicht Ihr Szenario Sprachmodell Language model hingegen beschreibt wie die Phoneme klingen aus denen die W rter aufgebaut sind Damit diese Verbindung funktioniert muss sowohl Ihr Szenario als auch Ihr Basismodell das selbe Phonemset verwenden Wenn Sie ein neues Szenario entwerfen ist es also eine gute Idee jenes W rterbuch als Schattenvokabular zu verwenden das verwendet wurde um das Basismodell zu generieren Auf diese Weise wird simon automatisch die richtigen Phoneme vorschlagen wenn W rter hinzugef gt werden Wenn Sie Szenarios verwenden die f r ein anderes Phonemset entwickelt wurden anderes Basismodell werden S e unter umst den beim Starten der Erkennung einen Fehler erhalten der betroffene Phoneme und damit assoziierte W rter anzeigt Um dies zu reparieren transkripieren Sie ihre W rter entsprechend des verwendeten Phonemset des Basismodells oder verwenden Sie ein anderes Basismodell oder benutzen Sie ein benu
Download Pdf Manuals
Related Search
Related Contents
OPERATOR`S MANUAL fks - manual ma 255 IPL, Best Green, BM125M107C, 2001-02, Tractor, FR EyeOn Baby Camera User Guide for Android - D NAS 3000 2-bay User Guide Instructions for use Copyright © All rights reserved.
Failed to retrieve file