lunes, 27 de junio de 2011

Oportunidades para los Lenguajes Documentales y sus usuarios

Conceptos básicos

etiquetado

El tagging o etiquetado libre es una nueva modalidad de indización en lenguaje natural que se utiliza de forma habitual a través de las herramientas y recursos de la web social. Es una de las características que definen el concepto de web 2.0.
Son nuevas alternativas para la organización y clasificación de la información, en el contexto la web social. El concepto de etiquetado se relaciona con la indización.
Yusef Hassan distingue entre dos posibles usos del tagging, uno de carácter social, otro de sentido personal. En su opinión sólo puede hablarse de un modelo novedoso de indización cuando se práctica la “indización social agregada”, es decir, cuando varios usuarios indizan un mismo recurso (Hassan, 2006). Otros autores utilizan el concepto de “etiquetado colaborativo” (McGregor y McCulloch, 2006), o reclaman una diferenciación entre el tagging de autor y el tagging realizado por los lectores (Seoane, 2007a).

folksonomía
El concepto de folcsonomía deriva etimológicamente de taxonomía y es producto de una simbiosis entre folk (pueblo), taxis y nomos. El término fue acuñado por Thomas Van der Wal en 2004.
Las folksonomías surgen cuando varios usuarios colaboran en la descripción de un mismo material informativo. Es una clasificación social que se genera por consenso a través de las aportaciones de los usuarios (Wright, 2004).
Las folcsonomías emplean el lenguaje natural, asignando libremente una serie de palabras clave de uso personal, capaces de categorizar cualquier tipo de contenido, información u objeto. Se basan en una arquitectura social de cooperación en la que cada usuario escoge las formas de representación que le facilitan su recuperación posterior.
Se presenta como una alternativa entre los lenguajes documentales, con la diferencia de que ésta se crea por agregación de información sin ningún punto de partida previo, y por ello se puede interpretar como reflejo de un poder popular (Quintarelli, 2005).


características
Según Santovenia González, las folcsonomías poseen ciertas caracterísiticas generales como son:
  • Uso del lenguaje natural no controlado para el etiquetado.
  • Realización de la indización por los creadores y usuarios de los recursos.
  • Indización de un mismo recurso por varios usuarios.
  • Elaboración de una descripción intersubjetiva.
  • Carencia de límites con respecto a la asignación de etiquetas, lo que incrementa la exhaustividad del lenguaje y lleva a una representación más consistente, pero que lo convierte en un instrumento de un tamaño desproporcionado.
  • No se precisa de ningún conocimiento previo para asignar una etiqueta.
  • Se trata de una clasificación popular.
  • Permite la navegación por el etiquetado.
  • No se explicitan las relaciones entre las etiquetas dentro de las folcsonomías.
  • Las etiquetas pueden tener referencias personales con un significado único para el usuario que las colocó, que eleva la proporción de términos carentes de una significación colectiva.
  • No existen reglas, esquemas o normas predefinidas para el control del etiquetado.
  • Los mismos términos pueden asignarse en plural o singular, se pueden emplear sinónimos y homónimos y pueden ocurrir otros fenómenos lingüísticos similares.
  • El etiquetado resulta una madeja compleja y muchas veces imprecisa.
  • Existe la posibilidad de extraer relaciones semánticas subyacentes.
  • Carece de estructura jerárquica, de relaciones directas o de asociación entre sus términos.
  • Los contribuyentes a una folcsonomía no están obligados a emplear una terminología predefinida para clasificar los recursos.
tipos de etiquetado
  • Etiquetado egoísta: El recurso se etiqueta con términos que sirven exclusivamente a los fines de un usuario en particular. Las etiquetas carecen de significado fuera del contexto personal.
  • Etiquetado "amiguista": El recurso se etiqueta para compartirlo con otras personas del círculo social al que pertenece quien asigna la etiqueta (amigos, compañeros de trabajo u otros).
  • Etiquetado altruista: El recurso se etiqueta con el propósito de compartirlo con todos los usuarios que sea posible. Se eligen etiquetas más representativas, conocidas y generalmente aceptadas.
  • Etiquetado populista: El recurso se etiqueta para hacerlo mas atractivo y que obtenga un número mayor de visitas. Se emplean etiquetas que sean populares y llamativas a una mayoría.
ventajas
  • El empleo de categorías relevantes para el usuario del recurso.
  • La reducción de la inconsistencia entre los indizadores: diferentes indizadores utilizan distintos términos para describir un mismo documento.
  • La creación de relaciones de semejanza, que permiten navegar por etiquetas relacionadas.
desventajas
  • Polisemia.
  • Sinonimia.
  • Uso indistinto de plurales y singulares.
  • Falta de exhaustividad en algunos etiquetados y profusión en otros, lo cual resta valor a la representación de la información.
  • Dificultad en la especificidad.
  • Etiquetado egocentrista.
  • Necesidad de conocimientos avanzados de programación para diseñar y poner en funcionamiento un sistema que posibilite la indización social y construya folcsonomías.
indización libre

Moreiro utiliza el concepto de indización libre en contraposición a indización controlada, para referirse al modelo de asignación de términos de materias sin la existencia previa de un vocabulario de referencia que determine la forma unívoca de las entradas que pueden emplearse en un sistema (Moreiro, 2004). Como ventajas de la indización libre, Moreiro (2004) señala las siguientes:

− No se precisa inversión para construir lenguajes documentales.

− Son lenguajes evolutivos.

− Ofrecen una enorme riqueza de vocabulario.

− Son fácilmente automatizables, al trabajar sobre todo con unitérminos.

− Se obtienen resultados satisfactorios cuando se combinan con los términos propios de un entorno científico-técnico específico.


APLICACIONES

La adaptación de los tesauros a la recuperación de información a texto completo en las fuentes electrónicas disponibles en Internet es uno de los principales retos actuales, que permitiría un avance considerable para la construcción de herramientas de la web semántica (Pérez Agüera, 2004).

Sólo si se adaptan e incorporan nuevos términos y variantes léxicas con agilidad, los tesauros estarán en condiciones de representar un rol en los sistemas de búsqueda en el texto libre en un futuro inmediato.

Las folksonomías aportan al campo profesional de la documentación:

– Abren un campo para la innovación y la experimentación, constituyen una fuente terminológica de indudable valor.

– Su incorporación en los recursos documentales es una tendencia con futuro.

– Su utilización en las bibliotecas virtuales y los repositorios ha sido señalada como una oportunidad que permite conectar a los productores de servicios documentales con los usuarios y creadores de contenidos.

– Incorporación de las folksonomías en los catálogos de bibliotecas.

– Aplicación de soluciones invisibles para el usuario final, como el empleo de “modelos propios de la indización automática sobre la indización social: ponderación mediante el empleo de las frecuencias de uso del tag, ponderación de los taggers por autoridad, desambiguación del significado en función del contexto, etc.”


REFERENCIAS:


CODINA, Lluís. Web Semántica y Sistemas de Información Documental. Gijón: Trea 2009.
http://digidocweb.net/webSemantica2009.pdf

RODRÍGUEZ YUNTA, Luis. Etiquetado libre frente a lenguajes documentales. Aportaciones en el ámbito de biblioteconomía y documentación. En: IX CONGRESO ISKO-ESPAÑA. Nuevas perspectivas para la difusión y organización del conocimiento. Actas del Congreso. Valencia: UPV, vol 2, pp. 832-845.
http://eprints.rclis.org/bitstream/10760/12571/1/Comunicacion_Luis_RYunta_ISKO2009.pdf

FRAGA, Anabel; SÁNCHEZ-CUADRADO, Sonia; MOREIRO, José Antonio; MORATO, Jorge. Los lenguajes documentales en la gestión de la información ¿un futuro prometedor o recurso del pasado?
http://bitrum.wordpress.com/2009/05/11/lenguajes-documentales-en-la-gestion-de-informacion-%C2%BFun-futuro-prometedor-o-recurso-del-pasado/

SANTOVENIA GONZÁLEZ, Obdulia María. Folcsonomías: el valor agregado de la indización social en el Web.
http://bvs.sld.cu/revistas/aci/vol20_3_09/aci06909.htm

Conclusiones del uso de Tesauro

Como ya comentaba en el último post, los problemas con el uso del Tesauro son, más o menos, iguales a los del uso de Encabezamientos de Materia. Esto viene dado porque al no encontrar un Tesauro adecuado (específico) para la temática de mis entradas en Delicious, los términos del Tesauro son tan amplios y generales como si usara los encabezamientos de Materia para Bibliotecas Públicas.

¿Solución? Unos Encabezamientos de Materia para Bibliotecas Especializadas en Filosofía y un Tesauro de Ética.

Lo que sí es cierto, es que, por un lado, los Encabezamientos son algo más flexibles porque nos permite jugar con los encabezamientos-subencabezamientos y podemos ser más específicos, por otro, este tesauro es rico en palabras, y esta variedad permite ser más concretos.

Claro está que el uso del Tesauro en las 20 entradas específicas para Tesauro ha sido más fácil, sin embargo, he de anotar que ha sido una búsqueda de entradas forzada, lo cual nos dice que en un uso "natural" de Delicious tendríamos problemas para ajustar las etiquetas con dicho Tesauro.

Esto me lleva a la conclusión de que es necesario afinar estos lenguajes, enriqueciéndolos en el caso de los encabezamientos de Materia y haciendo algunos de temas específicos que aún no se han hecho, en el caso de los Tesauros.
Estos lenguajes son una poderosa herramienta pero que necesita ajustes para poder ser utilizados en la web 2.0.
En mi caso concreto, creo que me es más fácil ajustar las etiquetas a mis necesidades de recuperación, que si bien los encabezamientos de Materia y Tesauros son una gran ayuda, no llegan a resolver el problema por completo.

Una mayor parte de la gente que utiliza Delicious lo hace con etiquetas muy personales, que se ajustan a sus necesidades, pero, me temo, sin ninguna estructura o jerarquía. Tener estructura o un esquema de conjuntos de términos ayuda a colocar las entradas fácilmente.

Al principio es fácil el etiquetado pero cuando vas avanzando con las entradas, sin una estructura previa es fácil liarse y eso se traduce en una posible pérdida en la recuperación de información. Además, con la entrada de nuevos marcadores siempre es necesario una revisión de los anteriores. La estructura se marca en base a lo que se tiene. Por ejemplo, podemos tener un sólo marcador con la etiqueta "Ética", pero cuando han entrado 20 marcadores y poseen la misma etiqueta o debemos añadir nuevas o debemos replantearnos la necesidad de clasificarlas de otra manera.

Mi cuenta de Delicious

Tesauro utilizado