next up previous contents
Next: El árbol de enlace Up: 2.7 Asociación multinivel Previous: 2.7 Asociación multinivel

2.7.1 La estructura de enlace

La parte central de esta estrategia la constituye la estructura de datos, con forma de árbol, que se utilizará para establecer los enlaces entre el texto y los componentes léxicos. Desde el punto de vista lógico, dicha estructura se caracteriza por:

Pasando ya a aspectos más prácticos, desde el punto de vista de la eficiencia computacional, debe poseer la suficiente flexibilidad como para permitir la realización de operaciones de inserción, modificación y borrado de nuevos componentes léxicos sin que ello suponga la realización de una costosa reorganización sobre una parte significativa del árbol.

Utilización de B árboles

Una estrcutura de datos que se adapta muy bien a estas características es la correspondiente a un tex2html_wrap_inline12931 árbol o a un B árbol. Se puede encontrar una descripción de las características de ambos tipos de árboles en [Korth y Silberschatz 87].

Las ventajas que presenta la utilización de un tex2html_wrap_inline12931 árbol son las siguientes:

Los B árboles, por su parte, presentan como ventajas más significativas:

Genéricamente, estas ventajas de los B árboles se ven ensombrecidas por los siguientes inconvenientes:

Se podría asumir la mayor complejidad asociada a la gestión de B árboles con el fin de diseñar una estructura de almacenamiento más compacta, aunque la utilización dual de los nodos intermediosgif suponga una disminición de la simplicidad y claridad que proporciona la estructura tex2html_wrap_inline12931 árbol

Utilización de claves segmentadas

La utilización de B o tex2html_wrap_inline12931 árboles impone la necesidad de utilizar la clave completa para etiquetar los nodos, de modo que la función de búsqueda siempre utiliza la totalidad de la clave en todos los niveles del árbol.

En este trabajo se propone la utilización de claves segmentadas para optimizar el proceso de búsqueda y la organización de la estructura arborescente. En cada nodo se utilizará el siguiente segmento de la clave como criterio de decisión para determinar el camino a seguir.

Como ya se expuso en la discusión de las otras estrategias, la interación del usuario con el editor de componentes léxicos se realiza directamente mediante pulsaciones sobre el texto, puesto que éste es el método más intuitivo y práctico para el usuario. Esto conlleva la necesidad de utilizar la posición de un carácter significativo del texto de cada componente léxico, generalmente el primero, como clave de acceso a la estructura de asociación con los componentes léxicos. Por consiguiente, el único método natural de segmentar la clave consiste en descomponerla en los valores de las coordenadas componentes, esto es, considerar cada clave como la composición del valor de la coordenada horizontal con el valor de la coordenada vertical.

El proceso de búsqueda utilizará la coordenada horizontal (el número de línea) para indexar el nodo raíz y obtener el nodo que representa los componentes léxicos de dicha línea, para a su vez indexar dicho nodo con el valor de coordenada vertical y obtener así el componente léxico cuyo texto comienza en esa posición.

Por consiguiente se utilizará una estructura de dos niveles de indexación, en la que el primer nivel permite discrimar el conjunto relevante de entradas del segundo nivel, las cuales apuntan directamente a los datos.


next up previous contents
Next: El árbol de enlace Up: 2.7 Asociación multinivel Previous: 2.7 Asociación multinivel

Miguel A. Alonso Pardo
Thu Nov 20 16:47:01 CET 1997