Modelos de Recuperacion I
Recuperación y Organizacion de la Información
Introducción a los Modelos de Recuperación
Los modelos de recuperacion constituyen hoy en dia una de las principales herramientas a la hora de facilitar una comparación entre una consulta determinada y una serie de textos sobre los cuales se realiza dicha consulta.
Los modelos de recuperacion son aplicables solamente a documentos de contenido unicamente textual. Su funcionamiento consiste en la creación de un indice determinado en funcion del contenido de dicho documento a recuperar. Tambien cabe destacar para los modelos de recuperacion los indices invertidos que consiste en proporcionar la relacion de documentos de texto en los que aparece una palabra especifica.
Para la creacion de indices de documentos se tienen encuenta factores como por ejemplo la frecuencia con la cual aparece la palabra en el documento.
Hoy en dia los modelos de recuperacion de informacion constituyen un elemento de maxima importancia debido al auge de los buscadores de internet y de la gran expansion de la red de redes. Por ello es necesario comprender como se estructuran internamente estos modelos de recuperacion.
Clasificación de los Modelos de Recuperación
A continuacion se muestra una clasificacion de los principales modelos de recuperacion existentes en la actualidad.
Este modelo de recuperación se basa en la teoria de conjuntos de algebra de boole. Debido a ello es un modelo de recuperacion de gran simplicidad y que fue en un primer momento adoptado por los primeros sistemas bibliograficos comerciales.
Su principal estrategia esta basada en un algoritmo de decision binaria, es decir se determina si un elemento esta o no contenido en el conjunto resultado.
Este modelo de recuperación se basa en espacios vectoriales proponiendo para ello un marco de emparejamiento parcial. Se asignan pesos a los términos índice de las preguntas y de los documentos. Estos pesos son usados para obtener similitud entre cada documento alamacenado y las preguntas propuestas por el el usuario.
Es modelo de recuperación esta en la equiparación probabilística. Para ello dada una pregunta por el usuario se calcula la probabilidad de que esa pregunta tenga relacion con el documento a recuperar
Otros temas relacionados se pueden encontrar en la siguiente pagina referente al Procesamiento del Lenguaje Natural y de Base de Datos Nativas