Home
Speakit - Documentación técnica
Contents
1. 9 cresteRecora InvertedindexRecordGenerator OccurrenceRecord A O getSortedAppearanceList O addDocuments OccurrenceRecordO 0 addSingleDocumentO O getDocumentO 1 A O generatedewRegisters O getkey O getDocuments O getTerm 3 OccurrencePartMerger OccurrenceStoragelmpl MockAppearanceStoragelmpl O getinvertedListGenerator o setDocument O getlexicon O setTermO 4 buffer ArrayList Occurrence OccurrencePartMerger MockAppearanceStoragelmplO O createRecord OccurrenceStoragelmpl O addOccurrence O mergel OccurrenceStoragelmpl O getapearanceListFor O addOccurrence O getSortedAppearanceList O cresteRecord O getApearanceListFor O getSortedAppearanceList 6 Lexicon O Occurrence O InvertedListGenerator o document long Lexicon n mica O generate O add O processTextDocuments O getAppearanceOrder Occurrence e hasl O compareTo O iterator O getDocumentO O size O getTermid O toString Problemas encontrados y soluciones propuestas Integridad de datos Trabajando con archivos muchas veces suced a que por un mal funcionamiento en los algoritmos de persistencia se graben y carguen datos en disco de forma erronea o incompleta provocando fallas en los lugares donde se procesaban Era muy dificil detectar si el problema proven a de datos o de la logica de procesamiento Para facilitar la
2. Reproducir Archivo 4 Realizar una consulta 0 1 Leer archivo de Texto Salir Ingrese la ruta a continuaci n Si su archivo es 1 txt s lo presione ENTER hamlet txt El documento contiene palabras desconocidas que deber grabar a continuaci n Palabra ser ENTER para grabar Grabando ENTER para detener ER para confirmar ER para grabar ara detener ER para confirmar TER para grabar ara detener ER para confirmar ER para grabar RR para detener ER para confirmar ER para grabar RR para detener ER para confirmar ER para grabar RR para detener ER para confirmar Reproduciendo ENT Palabra o ENT Grabando ENTER p Reproduciendo ENT Palabra no EN Grabando ENTER p Reproduciendo ENT Palabra esta ENT Grabando ENTE Reproduciendo ENT n Palabra esta ENT Grabando ENTE Reproduciendo ENT Palabra es ENT Grabando ENTE Reproduciendo ENT Palabra la ENT Grabando ENTE Reproduciendo ENTE Palabra cuestion Grabando ENTE Reproduciendo ENT ER para grabar RR para detener RR para confirmar RR
3. localizaci n de la fuente del problema se implement un m todo que permit a detectar datos corruptos al momento de leerlos de disco as por lo menos sabemos si el origen es o no de datos El m todo consiste en guardar al final de cada registro un campo byte con un hash de todos sus datos Luego al cargar un registro de disco se verifica si el campo hash coincide con el calculado sobre todos los datos del registro Si no coincide el dato es inv lido de lo contrario es altamente probable de que sea v lido A veces los datos corruptos hac an imposible cargar todo el registro y calcular el hash Por ejemplo cuando el registro tenia campos de tipo array y se corromp a el campo de control que indicaba la cantidad de elementos a veces era tan elevado que el sistema se quedaba sin memoria Par solucionarlo aplicamos el mismo m todo de hash usado en registros para cada campo de control de ese tipo MANUAL DE USUARIO Instrucciones de uso Instalaci n del sistem Para instalar y correr el sistema se requiere de la herramienta Apache Ant Esta herramienta puede conseguirse mediante el gestor de paquetes de su distribuci n de Linux o descargandolo de la p gina http ant apache org Si se elige esta ltima opci n se deben seguir las instrucciones de instalaci n de la herramienta proporcionadas en la p gina Para compilar o correr la aplicaci n utilizando la consola del sistema operativo ingresar al directorio speakit y ejecutar
4. ndolos de a uno creando las listas invertidas sincronizadamente y utilizando un algoritmo de sort externo Los documentos agregados ser n comprimidos en la pr xima etapa con el m dulo compression La b squeda de documentos se realiza a trav s del m dulo ftrs y se recuperan a trav s del m dulo documentsstorage Las listas invertidas del ftrs se almacenan en un archivo directo de registros por bloque que est indexado por un rbol B para agilizar las b squedas El arbol B est implementado en un m dulo independiente y en el m dulo ftrs se lo utiliza junto con un encoder que permite comprimir los t rminos en las hojas mediante front coding La garant a de funcionalidad y estabilidad del sistema est soportada por unas 200 pruebas autom ticas las cuales incluyen pruebas simples y pruebas de stress Las pruebas de stress utilizadas garantizan por ejemplo que el rbol B pueda indexar todas las palabras del idioma castellano v ase StressTreeTest con speakit test files lemario txt u otras por ejemplo garantizan la robustez del sistema ftrs Estas pruebas se pueden utilizar a modo de documentaci n t cnica adicional para aprender sobre el funcionamiento y la utilizaci n del sistema por lo cual recomendamos su lectura y ejecuci n Abreviaturas utilizadas en la presente obra Tipos de datos B Byte complemento a dos en dos byte EC Enteros Cortos complemento a dos en dos byte E Enteros complemento a dos en cuatro
5. SPEAKIT v2 0 1 Estructura general del sistema oomooocooncnnnncnnnncnnnnnrncnnrncnnrncnnrncanrnnannas 1 2 Abreviaturas utilizadas en la presente obra ssssssssssssuu2222225 2 it Tipos de AOS ada 2 3 Estructuras gen ricas de archivos de registros y de bloque ss 3 1 Archivo secuencial de registros SecuentialRecordFile ococccccconcccnconcnnnnnno 3 DE MV EAS A AAA AAA A a Ea 3 3 Archivo en bloques BasicBlockFilelMpl sssssssssssssssrrrerrrrssssssrrrrrrrrrrssess 4 4 Archivo Directo de registros DirectRecordFile 0coococccocconconnconcnnaconannnnnns 4 5 ADOBE a da A A E E 4 4 Estructuras gen ricas de campos utilizadas en esta versi n s s s 5 T COMPOSItEFIEl A a E E AT 5 2x Y ATA LA 5 5 Algunos archivos espec ficos de este sistema oommmnncoonnnnnnnonnenannnennnnanns 5 1 Indice de palabras del diccionario de audio occcocconccconcnnocnnnccnncnnnanonennonnns 5 2 Indice de nodos del trie del diccionario de audio 0ocoococcconconcconcnncnnncnnananos 5 3 Archivo de audios de palabras aaa Dada 5 4 Indice de listas invertidas 0oocococccnconnnonnanonannnnncnnnnn nan ronrannrrnrenranarneranos 5 5 Archivo de listas invertidas 0ococcoccocnnonnonononnanncon non na EEEE ARE 5 6 Estructuras que relacionan los ndices con los archivos directos SOCUeNCIaleS cocccccnncnncnncnnncnncnncnn nn 6 1 Diccionario de AUTO it td A A dd ai 6 2 AIN EEEE RAEE EAEE EPENTETIKOA 6 3 Resoluci n de c
6. alguno de los siguientes comandos ant clean Usando este comando se borran las carpetas utilizadas para compilar y distribuir la aplicaci n ant compile Con este comando se compila la aplicaci n generando los archivos class dentro de la carpeta build del proyecto ant run Al ejecutar este comando se compila y se ejecuta la aplicaci n ant Si se ejecuta el comando ant sin utilizar ning n parametro por default se ejecuta el comando ant run Utilizaci n del sistema Al iniciar la aplicaci n podemos ver la siguiente pantalla Menu Principal 1 Procesar un archivo de Texto 2 Procesar varios archivos de Texto 3 Reproducir Archivo 4 Realizar una consulta 0 Salir Aqui tenemos 5 opciones Procesar archivo de Texto En este m dulo el sistema pregunta por un archivo de texto para ser leido Si el archivo est dentro de la carpeta de la aplicaci n no es necesario ingresar la ruta al mismo solo se debe ingresar el nombre Una vez ingresado el nombre del archivo el sistema reconoce las palabras que ya est n agregadas al diccionario y las que no se encuentren en este se requerir que sean grabadas por el usuario Luego de grabar cada palabra el sistema reproducir la palabra preguntar al usuario si la palabra se grab correctamente y dar la posibilidad de regrabarla si asi lo desea el usuario Speak It Menu Principal 1 Procesar un archivo de Texto 2 Procesar varios archivos de Texto 3
7. alir separadas por coma hamlet txt speakit txt Los documentos ingresados contienen palabras desconocidas que deber grabar a continuaci n Palabra una ENTER para grabar Reproducir Archivo Con esta opci n podemos reproducir las palabras grabadas con anterioridad en la aplicaci n Se solicitar nuevamente el nombre del archivo ingresado y el sistema indicar por pantalla las palabras a reproducir consecutivamente y se escuchar su audio a continuaci n Spea Menu T3 0 3 2 Se 4 k It Principal Procesar un archivo de Texto Procesar varios archivos de Texto Reproducir Archivo Realizar una consulta Salir Ingrese la ruta a continuaci n Si su archivo es 1 txt s lo presione ENTER hamlet txt Se va a reproducir el siguiente documento Ser o no ser sta es la cuesti n Realizar una consulta Escriba los t rminos por los que quiere buscar y el sistema desplegar un listado de los documentos m s relevantes Speak It Menu Principal I4 0 4 2 Su 4 Procesar un archivo de Texto Procesar varios archivos de Texto Reproducir Archivo Realizar una consulta Salir Ingrese la consulta cuestion Los documentos encontrados para la consulta realizada se muestran a continuacion 1 Ser o no ser sta es la cuesti n Si quiere reproducir uno de los documentos listados presione 1 y a continuaci n escriba el n mero de docume
8. bytes EL Enteros Largos complemento a dos en ocho bytes F Fraccionarios punto flotante C Caracteres con longitud exacta entre par ntesis V Caracteres Variables hasta 255 con prefijo de longitud T Texto cantidad ilimitada de caracteres incluyendo caracteres de control como salto de l nea retorno de carro tabulaci n fin de texto L L gicos 0 Falso o No 1 Verdadero o S Estructuras gen ricas de archivos de registros y de bloque Archivo secuencial de registros SecuentialRecordFile Representa a un archivo de registros de acceso secuencial Permite insertar o buscar un registro Las b squedas se hacen en forma secuencial Trie Utilizado para el diccionario de audio TrieNodeBlockIndexFil WordOffsetFiele YF i c O TrieNodeBlockindexFile port Call Instantiate O WordOffsetField O createRecord A O isLlast isi O setLlast L nodeblockindexFile 0 1 O setNextRecord O Trie Import Call Instantiatep O setiWordo o depth int T Import Instantiate 0 hextNodeNumber long Tried Import O addWord O contains E O createRecord O TrieNode O TrieNodeBlockInde O getOffsetd O getTriefileName TrieNoded TrieNodeBlockindex0 Import Call Instantiatg O getTrieNodeBlockIndexFileNameg nfport Call Instantfatas clearWwordoffsetRecordList O getKey0 E O instal O getKey0 O setBlockNumber O isinstal
9. denamiento denominado sort Interno que va cargando en memoria una porci n del archivo desordenado y genera n 1 particiones ordenadas de igual tama o y una que puede ser menor El mecanismo escribe las particiones en un archivo secuencial usando registros de longitud fija donde se almacena nro_de termino nro_de_documento Soportando repetidos para poder procesar la frecuencia de cada termino dentro de los documentos Estas particiones se unen mediante un mecanismo de merge que consulta las particiones ordenadas previamente generadas y devuelve un nico archivo ordenado del mismo tipo que el generado por el algoritmo de ordenamiento Stop Words Se conoce como stop words a las palabras que pueden encontrarse comunmente en casi cualquier documento de texto tales como art culos preposiciones conectores etc A la hora de realizar una busqueda si se incluyen las stop words estas palabras estarian presentes en multiples documentos ensuciando asi los resultados Para evitar esto no se tienen en cuenta a la hora de indexar documentos como asi tampoco a la hora de realizar busquedas Diagrama de clases del paquete indexador interface QO InvertedindexRecordGenerator O OccurrenceRecord OccurrenceStorage interface RecordFactory speakit io record a invertedListGenerator InvertedListGenerator a lexicon Lexicon a document LongField e addOccurrence a term IntegerField O getApearanceListFor
10. ivo de documentos Archivo de documentos Implementado con un archivo de registros secuencial Almacena los documentos ingresados por el usuario Estructuras que relacionan los ndices con los archivos directos secuenciales Diccionario de audio Implementado con un trie Cuando el audio de una palabra se busca en el diccionario primero se busca el n mero de offset del audio en el trie que indiza al archivo de audio Una vez encontrado el offset con el trie el diccionario de audio devuelve el audio de la palabra buscada Los nodos del trie est n guardados en un archivo de registros en bloques y adem s hay un ndice de estos nodos de manera que cuando se busca cada nodo primero se consulta al ndice para saber en que bloque est y luego se busca el nodo en el bloque Indice invertido Este m dulo tiene una clase llamada InvertedIndex implementa el ndice invertido que sirve para la recuperaci n de textos En l se guardan los t rminos con sus respectivas listas invertidas Est compuesto por un archivo de datos y por un ndice primario exahustivo y selectivo El de datos est implementado con un archivo directo de registros variables El archivo indice es un bsharp del paquete speakit io bsharptree Definici n de los registros Indice Invertido Conceptual InvertedIndexRecordKX termino i cantidad_documentos maxima_frecuencia_local InvertedList Ocurrence documento ie frecuencia_local 3 gt Logica Inver
11. led O setNodeNumber O setNodeNumber O load O setiordOffsetRecordList O searchTrieNode Este modulo implementa un trie para el indice de palabra offset en el archivo de audio Su profundidad es parametrizable y utiliza un archivo directo con registros variables por bloques DirectRecordFile para guardar los nodos del trie y para acelerar la busqueda otro archivo que contiene el numero de nodo y el bloque del archivo anterior donde se encuentra cada nodo Asi al buscar un nodo se lo busca en el bloque adecuado y se evita recorrer secuencialmente el archivo de nodos del trie Definicion de los registros de los archivos Trie Conceptual TrieNodeX numero_nodo i wordOffsetList palabra proximo_nodo es_ultimo Logica TrieNodeXnumero_nodo EL wordOffsetList palabra V proximo_nodo EL es_ultimo L 3 gt Indice de nodos por bloque Conceptual TrieNodeBlockIndexf numero_nodo ie numero_bloque i gt Logica TrieNodeBlockIndex numero_nodo EL numero_bloque E gt Archivo en bloques BasicBlockFileImpl Esta clase permite el manejo de archivos por bloques de una forma b sica Tiene primitivas para crear un nuevo archivo de bloques cargar uno previamente creado agregar un bloque de bytes obtener un bloque de bytes y guardar un bloque de bytes Archivo Directo de registros DirectRecordFile Representa un archivo de registros de acceso directo Tiene primitivas para crear un nuevo archivo de registros ca
12. nto que quiere escuchar y el sistema se lo leer Si desea reproducir algun documento presione 1 Para realizar una nueva consulta presione 2 Para ir al menu principal presione 0 1 Elija el numero de documento que desea reproducir 1 Se va a reproducir el siguiente documento Ser o no ser sta es la cuesti n Salir Esta opci n permite salir de SpeakIt Menu Principal 1 Procesar un archivo de Texto 2 Procesar varios archivos de Texto 3 Reproducir Archivo 4 Realizar una consulta 0 Salir 0 Terminado Ejemplos Junto a la distribuci n del sistema se incluyen 2 test cases con documentos de ejemplos y los archivos binarios correspondientes Para poder usar efectivamente estos ejemplos se deben colocar junto a los binarios dentro de la carpeta raiz del proyecto Test Case 1 De estos test cases todos los archivos del primero han sido grabados por nosotros archivos de ejemplo desde el 1 al 10 Para probar hemos realizado las siguientes busquedas con su resultado ser O resultados Es una stop word la cuestion texto de ejemplo1 txt texto de ejemplo5 txt texto de los archivos ejemplo5 txt ejemplo7 txt ejemplo8 txt ejemplo9 txt presente en la rep blica texto de los archivos Jere dodao pubie ejemplo7 txt ejemplo8 txt ejemplo9 txt no sab a lo que hacia O resultados Las palabras no estan indexadas Test Case 2 Hemos incluido tambien 3 archivos m s de ejemplo pa
13. obtener el texto completo Diagrama de clases del indice invertido interface FTRS getinvalidWWordsForSearch indexDocument indexDocuments printindexForDebug search FTRSImpl interface O File speakit jo O load E FTRSIMpIO applyFiltersO getDocumentRepository getinvalidWWordsForSearch indexDocument indexDocuments install isinstalled load printindexForDebug o o o o o o o o o O search interface O Installable O install O isinstalled O StopWordsFilter interface O Speakitinterface speakit a stopWords ArrayList String gt StopWWordsFilter StopWordsFilter O getDefaultStopwWords getFileName getRelevant Words getStopWWords install isinstalled isStopWWord load addDocument addDocuments addWWordAudio convertToAudioDocument getinvalidWVordsForSearch getTextDocumentFromFile load printindexForDebug search 6 TermFilter 0 makeTerm O RankedSearchEngine a minTermFrecuency int a resultitemsCount int RankedSearchEngine O getiinTermFrecuency O getTopO O search O setiMinTermPrecuency O setResultitemsCount Indexaci n de multiples documentos Obtencion de las listas invertidas de cada termino Para la indexaci n de documentos se opto por el mecanismo de or
14. onsultas sssssessersrresrrrsrrsrrrrrrnsrrrrernsrrrerrnerrrerrrerrnn 6 4 Diagrama de clases del indice invertido cococccnccccnccnnnncnncnnnnnnnnnnnnnnna nan 7 7 Indexaci n de multiples docUmMentoS cccoccconcncncncanananannnnnranananananannanana 8 1 Obtencion de las listas invertidas de cada termino 0cccoccocccnnconcnnnannannannns 8 PO ALOI A O 8 3 Diagrama de clases del paquete indexador sssssssssssrrsrrrrssssserrrrrrrrrresens 8 8 Problemas encontrados y soluciones propuestas s s sss ssssss2255 9 1 Integridad ASAS ii A A AA AE 9 9 Instrucciones de USO ooccccoconcnnnnnnnnnnnnnnn nn 9 1 Instalaci n del SisteMa coococococnoncncnconenenannonenencononennnconenencnnonenencnnenennos 9 2 Utilizaci n del sistema senene e a a aa a a aea e a 10 10 EjemMploS ocoococoococoncncnnnnroncnnrncnnrncnnrnrnnrnrnncnnrnrnnrnrnnrnrnnrnrnnnnnrncanancananes 14 MANUAL DE USUARIO Estructura general del sistema Speakit es un sistema que lee documentos por salida de audio y los guarda indexados El sistema Speakit permite ingresar un documento de texto grabar todas las palabras que no est n registradas y agregarlas a un diccionario que asocia palabras con su audio y tambi n permite reproducir las palabras contenidas en un documento En esta versi n se agreg el m dulo de indexaci n y almacenamiento de documentos mientras que el m dulo de audio se conserv y se mejor En una etapa posterior estos doc
15. para detener ER para confirmar El documento fu agregado con xito ENTER para grabar N para para para para para para para para volver volver volver volver volver volver volver volver grabar grabar grabar grabar grabar grabar grabar grabar Si se ingresa un nombre de archivo que el sistema no puede encontrar se emitir un mensaje de error y la aplicaci n volvera al menu inicial Speak It Menu Principal 1 Procesar un archivo de Texto 2 Procesar varios archivos de Texto 3 Reproducir Archivo 4 Realizar una consulta 0 1 Leer archivo de Texto Salir Ingrese la ruta a continuaci n Si su archivo es 1 txt s lo presione ENTER lalala txt No pudo encontrarse el archivo lalala txt Speak It Menu Principal 1 Procesar un archivo de Texto 2 Procesar varios archivos de Texto 3 Reproducir Archivo 4 Realizar una consulta 0 Salir Procesar varios archivos de Texto Funciona igual a la opci n anterior s lo que permite ingresar mas de un documento a la vez Los nombres de archivo se deben escribir uno a continuaci n del otro separ ndolos por una coma Menu Principal 1 Procesar un archivo de Texto 2 Procesar varios archivos de Texto 3 Reproducir Archivo 4 Realizar una consulta 0 2 Ingrese cada una de las rutas de los documentos que desea ingresar S
16. ra probar el ingreso de los archivos y su grabaci n en el sistema Al intentar ingresar estos 3 archivos el sistema pedira que ingresemos los siguientes terminos los otros no son pedidos porque ya estan ingresados evitar robo por sus politicos los discipulos pudieron vez atrapado soldados romanos su calaban fondo cada persona lugar
17. rgar uno creado previamente insertar un registro en un bloque obtener un registro de un bloque actualizar un registro verificar si un registro existe y agregar un nuevo bloque Arbol B Representa un archivo de registros organizado en forma de rbol B Utilizado normalmente como ndice de un archivo directo Tiene las mismas primitivas que un archivo de registro como por ejemplo insertar registro y obtener registro a partir de una clave Si se utiliza el rbol como un ndice los registros que contiene son registros de ndice es decir un registro consistente en una clave y el n mero de bloque del archivo directo Este rbol B puede utilizar un encoder para guardar los datos en las hojas El encoder puede utilizarse para comprimir para encriptar o para hacer cualquier transformaci n de datos En este proyecto se utiliza para hacer front coding de las palabras guardadas en el ndice del ftrs Definici n de nodos del arbol Nodo Indice Definicion conceptual NodoIndiceX nro_nodo i nivel hijo_izquierd ie elemento_indice termino hijo_derecho ie gt 3 Definicion logica NodolndiceXnivel E hijo_izquierdo E Array cantidad_elementos E hash_cantidad_elementos B elemento_indice termino V nro_nodo E gt Nodo Hoja Definicion conceptual NodoHojaX nro_nodo i nivel 0 elemento_hoja InvertedIndex_IndexRecord siguiente_nodo ie gt Definicion conceptual NodoHojaXArray cantidad_elementos E hash_cantidad_elementos B In
18. tedIndexRecordXtermino V maxima_frecuencia_local E InvertedList cantidad_ocurrencias E hash_cantidad_ocurrencias B Ocurrence offset_documento EL frecuencia_local E hash_registro B3 gt Indice del Indice Invertido Conceptual InvertedIndex_IndexRecordX termino i bloque_datos iey Logica InvertedIndex_IndexRecordX FrontCodedStringField cant_caracterers_coincidentes EC caracteres_finales V V numero_bloque EL hash_registro B gt Resoluci n de consultas El sistema resuelve consultas utilizando el m todo vectorial para lograrlo procede de la siguiente forma El m dulo de FTRS recibe un documento de texto como consulta lo hace pasar por unos filtros de palabras dejando al documento s lo con los t rminos relevantes Estos filtros son los mismos que se usan para una indexaci n de documentos Luego para cada termino del documento se consulta al indice invertido y se obtiene un registro con lista de apariciones de ese en los documentos del sistema ordenadas por frecuencia local Se ordena la lista de registros por relevancia del t rmino Un t rmino es mas importante que otro si aparece en menos documentos Por cada registro se recorre la lista de apariciones se obtiene el identificador de cada documento y se lo agerga a la lista de resultados Estos documentos se agregan hasta que la lista de resultados llegue al limite de 10 documentos Luego por cada id de documento se consulta al modulo DocumentStorage para
19. umentos se guardar n en forma comprimida El m dulo Speakit tiene la funci n de agregar el audio de una palabra Adem s tiene la funci n de agregar un documento a la colecci n de documentos almacenados Esta funci n realiza su tarea vali ndose del m dulo documents Puede almacenar documentos a pesar de que el m dulo dictionary no contenga todas sus palabras Tambi n tiene la funci n de obtener todas las palabras desconocidas de los documentos almacenados lo cual sirve para grabar nuevas palabras En esta versi n del sistema audiofile sigue siendo de implementaci n secuencial pero el archivo que lo indexaba pas a ser un Trie El trie fue implementado sobre un archivo directo de registros por bloque que almacena los nodos del rbol y un archivo secuencial que se utiliza como ndice para saber en que bloque buscar un nodo sabiendo su n mero El archivo directo est implementado independientemente en la clase DirectRecordFile para poder ser reutilizado por otras estructuras que requieran el uso de un archivo directo El m dulo documentsstorage tiene la funcionalidad de guardar y buscar los documentos de texto guardados conociendo el offset dentro del archivo Cuando se agrega un nuevo documento el m dulo ftrs extrae los terminos relevantes dejando de lado los q se repiten comunmente tales como art culos proposiciones etc Si se agregan al sistema un conjunto de documentos estos se indexan de una manera m s ptima que ingres
20. vertedIndex_IndexRecord siguiente_nodo E nota la definici n de InvertedIndex_IndexRecord est en la secci n de Indice Invertido Estructuras gen ricas de campos utilizadas en esta versi n CompositeField Campo abstracto que representa un campo compuesto por otros campos ArrayField Campo compuesto por un arreglo de valores del mismo tipo y el campo de control que indica la cantidad de valores almacenados Algunos archivos espec ficos de este sistema ndice de palabras del diccionario de audio Implementado con un trie cuyos nodos se almacenan en un archivo de registros directo ndice de nodos del trie del diccionario de audio Implementado con un archivo secuencial Utilizado para encontrar los nodos del trie de forma m s eficaz Archivo de audios de palabras Implementado con un archivo de registros secuencial Almacena los audios de las palabras ndice de listas invertidas Implementado con un rbol B Contiene registros de ndice con clave y n mero de bloque En este caso la clave es el t rmino y el n mero de bloque apunta a un bloque del archivo de listas invertidas Archivo de listas invertidas Implementado con un archivo de registros directo por bloques Almacena las listas invertidas Las listas invertidas son un registro compuesto por un t rmino y un arreglo de n meros de documentos y frecuencia Los n meros de documentos coinciden con el offset donde se encuentra el documento en el arch
Download Pdf Manuals
Related Search
Related Contents
Turtle Beach ZBX0HW68224 headset DELL OptiPlex XE2 AHM Mémoire : Plan d`urbanisme de la Ville de Montréal LaCie LaPlug UFO Line Specifications condair 505 - Qviller AS Formations continues 2015 TPSK PRINTER SERIES USER MANUAL Peavey 3120 User's Manual Copyright © All rights reserved.
Failed to retrieve file