palabra clave
Un término índice, término de materia, encabezamiento de materia o descriptor, en recuperación de información, es un término que capta la esencia del tema de un documento. Los términos índice constituyen un vocabulario controlado para su uso en registros bibliográficos. Forman parte integrante del control bibliográfico, que es la función mediante la cual las bibliotecas recopilan, organizan y difunden los documentos. Se utilizan como palabras clave para recuperar documentos en un sistema de información, por ejemplo, un catálogo o un motor de búsqueda. Una forma popular de palabras clave en la web son las etiquetas, que son directamente visibles y también pueden ser asignadas por personas no expertas. Los términos índice pueden consistir en una palabra, frase o término alfanumérico. Se crean analizando el documento manualmente mediante indexación temática o automáticamente mediante indexación automática o métodos más sofisticados de extracción de palabras clave. Los términos del índice pueden proceder de un vocabulario controlado o asignarse libremente. Las palabras clave se almacenan en un índice de búsqueda. Las palabras comunes como los artículos (a, an, the) y las conjunciones (and, or, but) no se tratan como palabras clave porque es ineficaz hacerlo. Casi todos los sitios en inglés de Internet contienen el artículo "the", por lo que no tiene sentido buscarlo. El motor de búsqueda más popular, Google, eliminó de sus índices durante varios años las palabras de parada como "the" y "a", pero luego volvió a introducirlas, haciendo posible de nuevo ciertos tipos de búsqueda precisa. El término "descriptor" fue acuñado por Calvin Mooers en 1948. Se utiliza en particular para referirse a un término preferido de un tesauro. El lenguaje Simple Knowledge Organisation System (SKOS) ofrece una forma de expresar términos de índice con Resource Description Framework para su uso en el contexto de la Web Semántica.
