Home
5. FUNCIONALIDAD DE VOZ: REPRODUCCIÓN, GRABACIÓN
Contents
1. ic 5 12 P g 5 13
2. ALLES DE IMPLEMENTACION Funci n inic prepara el fichero que va a contener las muestras guardando informaci n en la cabecera relativa a su tama o y frecuencia de muestreo Calcula el n mero de bancos necesarios en funci n de la duraci n del fichero y de la frecuencia de muestreo indicada e inicia la grabaci n Funci n idle cuando detecta que el DSP ha cambiado de banco recoge las muestras del banco que se acaba de rellenar y las guarda en el fichero que se est grabando La grabaci n se finaliza bien porque se alcanza la duraci n indicada bien porque se ha detectado silencio dependiendo del valor de uno de los par metros de entrada que admite la instrucci n asociada En este ltimo caso si transcurre el intervalo de tiempo indicado y no se ha detectado silencio tambi n se dar por terminada la grabaci n Si la grabaci n ha de finalizar por detecci n de silencio se calcula la energ a de cada banco que se recoge del DSP y se compara con un umbral Para dar por finalizada la detecci n han de detectarse dos bancos consecutivos con una energ a por debajo del umbral siempre que antes se haya detectado un banco con energ a por encima del umbral El umbral se puede configurar modificando una entrada del fichero VISHA INI seg n se describe en el Apendice A Manual del Usuario Funci n fin Cierra el fichero que se est grabando y deja al DSP en estado OCIOSO Si la grabaci n ha finalizado por detecci n de silencio corr
3. Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento 5 FUNCIONALIDAD DE VOZ REPRODUCCI N GRABACI N S NTESIS Y RECONOCIMIENTO 5 1 INTRODUCCI N En este cap tulo se comentan las funciones relacionadas con el manejo de voz reproducci n grabaci n s ntesis y reconocimiento Se tratar n aspectos de implementaci n como el dise o de las funciones idle de segundo nivel de cada una de ellas y sus funciones inic y fin asociadas Tambi n se incluyen los diagramas de flujo de las funciones idle de segundo nivel para facilitar el seguimiento de las explicaciones sobre su implementaci n 5 2 REPRODUCCI N Nos permite enviar mensajes pregrabados al usuario los cuales deben estar guardados en ficheros como muestras de voz La calidad de estos mensajes es mayor que la de los mensajes sintetizados pero obliga a que los mensajes que se manden sean fijos DETALLES DE IMPLEMENTACION e Funci n inic dependiendo del tama o del fichero a reproducir calcula el n mero de bancos del DSP que habr que enviar variable n_bancos rellena los dos bancos del DSP e inicia la reproducci n Si el tama o del fichero a reproducir es menor que un banco el primer banco se rellena con ceros y el segundo banco s lo contendr ceros e Funci n idle va enviando trozos del fichero a los bancos del DSP a medida que ste los va consumiendo El ltimo banco a enviar se rellena con ceros S lo real
4. e nada El preprocesamiento es monol nea es decir s lo una l nea puede estar haciendo llamadas a las funciones de preprocesamiento Para sincronizar las diferentes l neas se utiliza una bandera flag de tal forma que cuando una l nea desea sintetizar lo har si la bandera est libre y si es as la cerrar hasta que termine Si no estuviera libre se quedar esperando hasta que lo est lo cual ocurrir cuando la l nea que estaba en la fase de preprocesamiento termine Una vez realizado el preprocesamiento se debe reproducir el fichero generado en memoria con el resultado de la s ntesis Esta reproducci n si es multil nea P g 5 7 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento 5 5 RECONOCIMIENTO DE VOZ Permitir al usuario realizar una elecci n entre varias posibilidades planteadas por el sistema e introducir cadenas num ricas d gito a d gito El reconocimiento de tonos multifrecuencia se tratar en el cap tulo dedicado a la tarjeta interfaz de l nea DETALLES DE IMPLEMENTACION e Funci n inic inicializa algunas variables que utilizar la funci n idle reserva memoria para la palabra a reconocer y su segundo candidato y pone al DSP en modo reconocimiento Si est permitida la detecci n de tonos multifrecuencia se llama a su funci n inic e Funci n idle si se ha interrumpido la reproducci n o la s ntesis anterior al reconocimiento mediante el env o d
5. e un tono multifrecuencia se intenta validar el d gito pulsado Si est activada la detecci n de tonos multifrecuencia se comprueba si hay tono cuando en el diagrama se pregunta hay tono lo que se est haciendo es una llamada a la funci n idle de segundo nivel encargada de la detecci n de tonos multifrecuencia ver Cap tulo 6 Lo anterior se comprueba cada vez que se entra en esta funci n Despu s de comprobar lo anterior se inicia el reconocimiento de voz Se reestima el ruido de la l nea telef nica se manda un pitido al usuario si la variable interna n_usa_pitido est a 1 y se aplica el algoritmo One Pass a las muestras obtenidas por el DSP cuando nos informe que ha reconocido algo Este proceso est dividido en estados de tal forma que cada vez que se entra en esta funci n se ejecuta uno de ellos El algoritmo One Pass se ejecuta en tres fases coincidiendo cada una de ellas con un estado En el caso de detecci n de tonos multifrecuencia se comprueba si la palabra reconocida est permitida Si no lo est se genera el error NO RECONOCIDO Asimismo si no se detecta nada en el tiempo prefijado se generar el error TIMEOUT Ambos errores ser n tratados seg n se indique en la secci n de tratamiento de errores del programa que se est ejecutando Cuando la funci n acaba bien porque se produzca el error NO RECONOCIDO bien porque se ha reconocido una de las palabras permitidas se escribe en la variable interna s_orig
6. en_reco cual ha sido el origen de la detecci n voz o DTMF esta informaci n s lo ser til si est n permitidos ambos modos de reconocimiento s_fipo_reco AMBOS Esto nos puede ser til por ejemplo para adecuar los mensajes a reproducir en el tratamiento de error NO RECONOCIDO e Funci n fin se libera la memoria din mica solicitada para guardar la palabra a reconocer y su segundo candidato y se desactiva el reconocimiento dejando al DSP en estado OCIOSO P g 5 8 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento P g 5 9 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento P g 5 10 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento P g 5 11 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento 5 6 CAMBIO DE MODO DE RECONOCIMIENTO DURANTE LA EJECUCI N DE UNA APLICACI N Se controla a trav s de la variable interna s_fipo_reco asign ndole uno de los tres valores siguientes e VOZ reconocimiento de voz e DTMF reconocimiento de tonos multifrecuencia e AMBOS se puede utilizar tanto reconocimiento de voz como de tonos multifrecuencia indistintamente y ante cualquier petici n al usuario Por ejemplo si se le est pidiendo al usuario del sistema que introduzca una cadena dicho usuario podr a utilizar la voz para decir algunos d gitos
7. ige la cabecera que escribi la funci n inic P g 5 5 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento P g 5 6 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento 5 4 S NTESIS Permite sintetizar mensajes que se indica en la propia instrucci n como una cadena de texto realizando la conversi n texto voz En este caso no se ha realizado una versi n multil nea completa debido a su complejidad y a que hay un proyecto en marcha que se encargar de ello Como soluci n provisional se ha modificado el preprocesamiento de tal forma que es posible realizarlo a trav s de sucesivas llamadas llamadas que consumen muy poco tiempo Respecto a la s ntesis tambi n se ha modificado para que se pueda realizar a trav s de sucesivas llamadas y la salida no se env a a la tarjeta VISHA sino que se guarda en memoria Una vez que tenemos el mensaje sintetizado en memoria se reproduce utilizando funciones de reproducci n en memoria que son b sicamente id nticas a las que se utilizan para reproducir un mensaje pregrabado a trav s de disco con la salvedad de tomar las muestras de memoria DETALLES DE IMPLEMENTACION e Funci n inic inicializa algunas variables que utilizar la funci n idle e Funci n idle realiza el preprocesamiento del texto a sintetizar e inicia la reproducci n de las muestras que se han guardado en memoria e Funci n fin no hac
8. iza la reproducci n de un fichero Es responsabilidad de la funci n idle de primer nivel llamarle tantas veces como ficheros haya que reproducir P g 5 1 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento e Funci n fin Cierra el fichero que se est reproduciendo y deja al DSP en el estado OCIOSO Cuando se alcanza el ltimo banco se modifica la variable del DSP que indica el final del banco que se est reproduciendo As evitamos reproducir el silencio final los ceros con que se ha rellenado A n as es necesario rellenar con ceros pues mientras el sistema reacciona el DSP sigue reproduciendo Otra optimizaci n se aplica a los ficheros a reproducir cuyo tama o est comprendido entre 1 y 2 bancos En estos casos se reparten las muestras equitativamente entre los dos bancos del DSP La raz n es evitar que se repita el primer banco en el caso de que las muestras a ocupar el segundo banco sean tan pocas que el sistema no sea capaz de detectar el cambio de banco P g 5 2 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento P g 5 3 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento P g 5 4 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento 5 3 GRABACI N Permite guardar en un fichero de muestras de voz lo que el usuario diga durante un cierto tiempo DET
9. y tonos multifrecuencia para los dem s El valor que asignemos a esta variable se puede hacer en cualquier punto del programa PRO que describe la aplicaci n e incluso en varios puntos y con valores distintos Los valores anteriores se pueden escribir en may sculas o min sculas pero se debe tener la precauci n de si se utiliza la variable s_fipo_reco en la condici n de una instrucci n if escribirlos como se hayan definido pues la comparaci n de cadenas s distingue entre may sculas y min sculas en el apartado A 5 3 2 del Ap ndice A Manual del Usuario se muestra una SECCION_ERRORES est ndar donde se utiliza el valor de la variable s_fipo_reco para reproducir un mensaje u otro al usuario en el tratamiento TIMEOUT P g 5 12 Cap tulo 5 Funcionalidad de voz reproducci n grabaci n s ntesis y reconocimiento 5 FUNCIONALIDAD DE VOZ Reproducci n grabaci n s ntesis y teconociMientO cai 5 1 5 1 INTRODUCCI N co coocccocinccconicaconicnciniccnicoraiaco sarna rcen conca inn aeseia reseca ce radares 5 1 5 2 REPRODUCCI N iociocicccinnccacccsiciciccccccccriraccricacccaiesoriccccecccicn cerca ccricaccci casi 5 1 53 GRABACI N noco oses onses osese sese seso is enses onses soseen o seese se osos eeose ense esec ses 5 5 A O A E E E E 5 7 5 5 RECONOCIMIENTO DE VOZ seeesssossessocesssocssssocssssoosesssocecssosesssosssssoesssssesesee 5 8 5 6 CAMBIO DE MODO DE RECONOCIMIENTO DURANTE LA EJECUCI N DE UNA APLICACION
Download Pdf Manuals
Related Search
Related Contents
manual do operador roçadeira elétrica rne1200 High Resolution 37X Zoom Color Camera SCZ-2370 2015年用VOICE201Xパンフレット(PDF 0.6MB) CORTADORA DE LOSA MQ SP2 Samsung SM-T705 Инструкция по использованию Miele T 1413 T 1415 User's Manual LG wm2455hw User's Manual Silicon Graphics® 550 Visual Workstation Guía del usuario Maxspect Celestial User Manual v1.0 - M K S Copyright © All rights reserved.
Failed to retrieve file