lunes, 27 de junio de 2011

Oportunidades para los Lenguajes Documentales y sus usuarios

Conceptos básicos

etiquetado

El tagging o etiquetado libre es una nueva modalidad de indización en lenguaje natural que se utiliza de forma habitual a través de las herramientas y recursos de la web social. Es una de las características que definen el concepto de web 2.0.
Son nuevas alternativas para la organización y clasificación de la información, en el contexto la web social. El concepto de etiquetado se relaciona con la indización.
Yusef Hassan distingue entre dos posibles usos del tagging, uno de carácter social, otro de sentido personal. En su opinión sólo puede hablarse de un modelo novedoso de indización cuando se práctica la “indización social agregada”, es decir, cuando varios usuarios indizan un mismo recurso (Hassan, 2006). Otros autores utilizan el concepto de “etiquetado colaborativo” (McGregor y McCulloch, 2006), o reclaman una diferenciación entre el tagging de autor y el tagging realizado por los lectores (Seoane, 2007a).

folksonomía
El concepto de folcsonomía deriva etimológicamente de taxonomía y es producto de una simbiosis entre folk (pueblo), taxis y nomos. El término fue acuñado por Thomas Van der Wal en 2004.
Las folksonomías surgen cuando varios usuarios colaboran en la descripción de un mismo material informativo. Es una clasificación social que se genera por consenso a través de las aportaciones de los usuarios (Wright, 2004).
Las folcsonomías emplean el lenguaje natural, asignando libremente una serie de palabras clave de uso personal, capaces de categorizar cualquier tipo de contenido, información u objeto. Se basan en una arquitectura social de cooperación en la que cada usuario escoge las formas de representación que le facilitan su recuperación posterior.
Se presenta como una alternativa entre los lenguajes documentales, con la diferencia de que ésta se crea por agregación de información sin ningún punto de partida previo, y por ello se puede interpretar como reflejo de un poder popular (Quintarelli, 2005).


características
Según Santovenia González, las folcsonomías poseen ciertas caracterísiticas generales como son:
  • Uso del lenguaje natural no controlado para el etiquetado.
  • Realización de la indización por los creadores y usuarios de los recursos.
  • Indización de un mismo recurso por varios usuarios.
  • Elaboración de una descripción intersubjetiva.
  • Carencia de límites con respecto a la asignación de etiquetas, lo que incrementa la exhaustividad del lenguaje y lleva a una representación más consistente, pero que lo convierte en un instrumento de un tamaño desproporcionado.
  • No se precisa de ningún conocimiento previo para asignar una etiqueta.
  • Se trata de una clasificación popular.
  • Permite la navegación por el etiquetado.
  • No se explicitan las relaciones entre las etiquetas dentro de las folcsonomías.
  • Las etiquetas pueden tener referencias personales con un significado único para el usuario que las colocó, que eleva la proporción de términos carentes de una significación colectiva.
  • No existen reglas, esquemas o normas predefinidas para el control del etiquetado.
  • Los mismos términos pueden asignarse en plural o singular, se pueden emplear sinónimos y homónimos y pueden ocurrir otros fenómenos lingüísticos similares.
  • El etiquetado resulta una madeja compleja y muchas veces imprecisa.
  • Existe la posibilidad de extraer relaciones semánticas subyacentes.
  • Carece de estructura jerárquica, de relaciones directas o de asociación entre sus términos.
  • Los contribuyentes a una folcsonomía no están obligados a emplear una terminología predefinida para clasificar los recursos.
tipos de etiquetado
  • Etiquetado egoísta: El recurso se etiqueta con términos que sirven exclusivamente a los fines de un usuario en particular. Las etiquetas carecen de significado fuera del contexto personal.
  • Etiquetado "amiguista": El recurso se etiqueta para compartirlo con otras personas del círculo social al que pertenece quien asigna la etiqueta (amigos, compañeros de trabajo u otros).
  • Etiquetado altruista: El recurso se etiqueta con el propósito de compartirlo con todos los usuarios que sea posible. Se eligen etiquetas más representativas, conocidas y generalmente aceptadas.
  • Etiquetado populista: El recurso se etiqueta para hacerlo mas atractivo y que obtenga un número mayor de visitas. Se emplean etiquetas que sean populares y llamativas a una mayoría.
ventajas
  • El empleo de categorías relevantes para el usuario del recurso.
  • La reducción de la inconsistencia entre los indizadores: diferentes indizadores utilizan distintos términos para describir un mismo documento.
  • La creación de relaciones de semejanza, que permiten navegar por etiquetas relacionadas.
desventajas
  • Polisemia.
  • Sinonimia.
  • Uso indistinto de plurales y singulares.
  • Falta de exhaustividad en algunos etiquetados y profusión en otros, lo cual resta valor a la representación de la información.
  • Dificultad en la especificidad.
  • Etiquetado egocentrista.
  • Necesidad de conocimientos avanzados de programación para diseñar y poner en funcionamiento un sistema que posibilite la indización social y construya folcsonomías.
indización libre

Moreiro utiliza el concepto de indización libre en contraposición a indización controlada, para referirse al modelo de asignación de términos de materias sin la existencia previa de un vocabulario de referencia que determine la forma unívoca de las entradas que pueden emplearse en un sistema (Moreiro, 2004). Como ventajas de la indización libre, Moreiro (2004) señala las siguientes:

− No se precisa inversión para construir lenguajes documentales.

− Son lenguajes evolutivos.

− Ofrecen una enorme riqueza de vocabulario.

− Son fácilmente automatizables, al trabajar sobre todo con unitérminos.

− Se obtienen resultados satisfactorios cuando se combinan con los términos propios de un entorno científico-técnico específico.


APLICACIONES

La adaptación de los tesauros a la recuperación de información a texto completo en las fuentes electrónicas disponibles en Internet es uno de los principales retos actuales, que permitiría un avance considerable para la construcción de herramientas de la web semántica (Pérez Agüera, 2004).

Sólo si se adaptan e incorporan nuevos términos y variantes léxicas con agilidad, los tesauros estarán en condiciones de representar un rol en los sistemas de búsqueda en el texto libre en un futuro inmediato.

Las folksonomías aportan al campo profesional de la documentación:

– Abren un campo para la innovación y la experimentación, constituyen una fuente terminológica de indudable valor.

– Su incorporación en los recursos documentales es una tendencia con futuro.

– Su utilización en las bibliotecas virtuales y los repositorios ha sido señalada como una oportunidad que permite conectar a los productores de servicios documentales con los usuarios y creadores de contenidos.

– Incorporación de las folksonomías en los catálogos de bibliotecas.

– Aplicación de soluciones invisibles para el usuario final, como el empleo de “modelos propios de la indización automática sobre la indización social: ponderación mediante el empleo de las frecuencias de uso del tag, ponderación de los taggers por autoridad, desambiguación del significado en función del contexto, etc.”


REFERENCIAS:


CODINA, Lluís. Web Semántica y Sistemas de Información Documental. Gijón: Trea 2009.
http://digidocweb.net/webSemantica2009.pdf

RODRÍGUEZ YUNTA, Luis. Etiquetado libre frente a lenguajes documentales. Aportaciones en el ámbito de biblioteconomía y documentación. En: IX CONGRESO ISKO-ESPAÑA. Nuevas perspectivas para la difusión y organización del conocimiento. Actas del Congreso. Valencia: UPV, vol 2, pp. 832-845.
http://eprints.rclis.org/bitstream/10760/12571/1/Comunicacion_Luis_RYunta_ISKO2009.pdf

FRAGA, Anabel; SÁNCHEZ-CUADRADO, Sonia; MOREIRO, José Antonio; MORATO, Jorge. Los lenguajes documentales en la gestión de la información ¿un futuro prometedor o recurso del pasado?
http://bitrum.wordpress.com/2009/05/11/lenguajes-documentales-en-la-gestion-de-informacion-%C2%BFun-futuro-prometedor-o-recurso-del-pasado/

SANTOVENIA GONZÁLEZ, Obdulia María. Folcsonomías: el valor agregado de la indización social en el Web.
http://bvs.sld.cu/revistas/aci/vol20_3_09/aci06909.htm

Conclusiones del uso de Tesauro

Como ya comentaba en el último post, los problemas con el uso del Tesauro son, más o menos, iguales a los del uso de Encabezamientos de Materia. Esto viene dado porque al no encontrar un Tesauro adecuado (específico) para la temática de mis entradas en Delicious, los términos del Tesauro son tan amplios y generales como si usara los encabezamientos de Materia para Bibliotecas Públicas.

¿Solución? Unos Encabezamientos de Materia para Bibliotecas Especializadas en Filosofía y un Tesauro de Ética.

Lo que sí es cierto, es que, por un lado, los Encabezamientos son algo más flexibles porque nos permite jugar con los encabezamientos-subencabezamientos y podemos ser más específicos, por otro, este tesauro es rico en palabras, y esta variedad permite ser más concretos.

Claro está que el uso del Tesauro en las 20 entradas específicas para Tesauro ha sido más fácil, sin embargo, he de anotar que ha sido una búsqueda de entradas forzada, lo cual nos dice que en un uso "natural" de Delicious tendríamos problemas para ajustar las etiquetas con dicho Tesauro.

Esto me lleva a la conclusión de que es necesario afinar estos lenguajes, enriqueciéndolos en el caso de los encabezamientos de Materia y haciendo algunos de temas específicos que aún no se han hecho, en el caso de los Tesauros.
Estos lenguajes son una poderosa herramienta pero que necesita ajustes para poder ser utilizados en la web 2.0.
En mi caso concreto, creo que me es más fácil ajustar las etiquetas a mis necesidades de recuperación, que si bien los encabezamientos de Materia y Tesauros son una gran ayuda, no llegan a resolver el problema por completo.

Una mayor parte de la gente que utiliza Delicious lo hace con etiquetas muy personales, que se ajustan a sus necesidades, pero, me temo, sin ninguna estructura o jerarquía. Tener estructura o un esquema de conjuntos de términos ayuda a colocar las entradas fácilmente.

Al principio es fácil el etiquetado pero cuando vas avanzando con las entradas, sin una estructura previa es fácil liarse y eso se traduce en una posible pérdida en la recuperación de información. Además, con la entrada de nuevos marcadores siempre es necesario una revisión de los anteriores. La estructura se marca en base a lo que se tiene. Por ejemplo, podemos tener un sólo marcador con la etiqueta "Ética", pero cuando han entrado 20 marcadores y poseen la misma etiqueta o debemos añadir nuevas o debemos replantearnos la necesidad de clasificarlas de otra manera.

Mi cuenta de Delicious

Tesauro utilizado

martes, 17 de mayo de 2011

Mi Tesauro…


“Un tesauro es un vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas y genéricas: de equivalencia, jerárquicas y asociativas. Se trata de un instrumento de control terminológico que permite convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa, de manera unívoca, el contenido de estos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.”
María Jesús Lamarca Lapuente

Primer Paso: Analizar el trabajo a realizar

Debemos tener en cuenta el hecho de que el primer trabajo de Delicious se realizó con Encabezamientos de Materia para bibliotecas públicas y éste, en el que nos embarcamos, se trata de la elección de un Tesauro que pueda ser utilizado en nuestra cuenta Delicious.

Para ello tenemos en cuenta las diferencias entre los Encabezamientos de Materia y los Tesauros:
Los Encabezamientos de Materia poseen mayor riqueza terminológica que los Tesauros, carecen de las agrupaciones de términos que originan las microdisciplinas y su forma gramatical es más compleja y menos natural que la de los Tesauros.

(Realización propia)


Segundo Paso: Analizar mis Bookmarks de Delicious

En mi cuenta de Delicious sólo tenemos 48 etiquetas (Tags) debido a que hay bastante similitud de tema entre los distintos marcadores (Bookmarks). Este hecho nos va a ayudar a poder agruparlos por temas, áreas (una de las características de los Tesauros) y poder elegir un Tesauro apropiado.

Podemos englobar nuestros marcadores (EM) en 3 campos temáticos. La metodología ha sido la siguiente: hacer subconjuntos temáticos con ellos y entre ellos y no tanto basándonos en el número de veces que se hayan utilizado. Son los siguientes:

(1) Ética (Ética, Especismo, Veganismo, Esclavitud, Ecologismo, Bioética, Experimentación_con animales, Antropocentrismo, Igualitarismo, Animales-Derechos, Animales-Consumo)

(2) Alimentación (Aditivos_alimentarios, Animales-Cifras_de consumo, Consumo, Colorantes, Granjas-Animales, Mataderos-Investigación, Cerdos-Investigación, Veganismo-Alimentación, Veganismo-Recetas)

(3) Filosofía (Tags: Filosofía, Ferrater_Mora-Filosofía, Aristoteles- Filosofía, Henry_Salt-Filosofía)

Obviamente hay marcadores que se han quedado fuera de estos conjuntos (Animales-Conducta, Diccionarios, Psicología, etc.).

Tercer Paso: Buscando mi Tesauro

Tras buscar y buscar y buscar y buscar… no he conseguido encontrar ningún Tesauro que sea específicamente de Ética o Filosofía.

Lo más cercano que he encontrado y, que de alguna manera, puede describir los términos más relevantes (lo que luego serían los descriptores) sería el Tesauro Europeo de la Educación. Fue realizado por Comisión de las Comunidades Europeas, Council of Europe y REDINED en 2003.

Es de carácter general, sin embargo, podría adecuarse a nuestras necesidades, a la vista de las nulas alternativas que tenemos.

Es un tesauro en español, monolingüe y muy fácil de usar. Cuenta con una lista alfabética y otra sistemática y una interfaz clara y muy intuitiva. Está muy bien elaborado y es muy fácil de usar y consultar.

En su lista sistemática podemos encontrar un apartado (14) sobre Filosofía y Religión que podría adecuarse bastante bien a nuestros términos.


REFERENCIAS

IZQUIERDO ARROYO, José María y MORENO FERNÁNDEZ, Luis Miguel. Listas de encabezamientos de materia y Thesauri en perspectiva comparada. Documentación de las Ciencias de la Información, nº 17, 1994. http://revistas.ucm.es/inf/02104210/articulos/DCIN9494110287A.PDF

LOS TESAUROS COMO HERRAMIENTAS TERMINOLÓGICAS. - Universidad de León

Lenguajes documentales: Los tesauros. Universidad Complutense de Madrid

lunes, 16 de mayo de 2011

Caminando entre Tesauros II

Astronomy Thesaurus

Se trata de un Tesauro de astronomía multilingüe.
La dificultad para manejarlo radica en la falta de introducción, instrucciones de uso o cualquier guía para recorrerlo que esté en español.

Se compone de:

(1) Índice: Por el orden de las letras del alfabeto se permite el acceso a las distintas páginas que componen el índice. Cuando se selecciona la letra, aparecen todas aquellas palabras que componen todas las palabras que empiezan por esa letra en formato texto (dificulta la lectura). Cuando pinchamos en la palabra que queremos, aparece una página con: enlaces para cambiar de idioma, un listado de la misma entrada en otros idiomas y los descriptores y no descriptores asociados a ella.

(2) Lista jerárquica: Este servicio está disponible en la página principal y pinchando en la bandera de cada idioma se tendrá acceso a la lista de nuevo. Serían éstos los campos semánticos que nos llevan a las palabras contenidos en ellos y que son los descriptores y no descriptores.

Las banderas, que representan cada idioma, son las que hacen de enlace a Inicio. Al principio es un poco lioso y crees que andas perdido hasta que das con ello y resulta más sencillo. Sin embargo, debería ser más accesible y no dar la sensación de que al pinchar en una palabra ya estamos perdidos y ahogados en dicho Tesauro. Unos cuantos enlaces más serían de gran ayuda o una página algo más completa.

Los términos del Tesauro son hiperenlaces que te conducen de unos términos a otros a través de dicho lenguaje.

Caminando entre Tesauros I

Tesauro de redes de ordenadores

Se trata de un Tesauro de informática realizado por el Departamento de Información y Documentación de la Universidad de Murcia.

Características:

Para su confección han utilizado como fuentes de información, documentación desarrollada de forma previa por otros equipos de trabajo y de investigación, como una edición electrónica de una clasificación sobre redes de ordenadores elaborada por un comité técnico de la A.C.M. (Association for Computer Machines), glosarios de términos informáticos, diccionarios electrónicos y manuales especializados.

La sintaxis empleada sigue la Norma Colombiana 1476 de Documentación-Directrices para el Establecimiento y Desarrollo de Tesauros Monolingües, de 1980, con algunas modificaciones.

Aunque se trata de un Tesauro monolingüe en Español, se mantienen en inglés y/o en acrónimo aquellos términos que en la gran mayoría de textos figuran claramente así recogidos. Se han traducido al español como descriptores cuando han resultado lo suficientemente representativos.

El Tesauro está integrado por los siguientes 5 campos semánticos: Arquitectura y Diseño de Redes; Comunicaciones de Datos; Protocolos de Comunicaciones; Redes Locales, Metropolitanas y de Área Amplia; Sistemas Distribuidos.

La estructura tripartita habitual del Tesauro se visualiza aquí en tres modalidades:

(1) Sistemática: los descriptores en el contexto de su campo semántico. Por ejemplo:

--ARQUITECTURA Y DISEÑO DE REDES
------Arquitectura de Red Local
------ARCnet
------F.D.D.I.
------Redes Ethernet
----------Ehternet 10Base 2
----------Ethernet 10Base 5
----------Ethernet 10Base T
------Token Ring

(2) Alfabética: entrada por la primera palabra significativa de descriptores y no descriptores y que expresa las relaciones del vocabulario. Por ejemplo:

ADRESS RESOLUTION PROTOCOL
USE : A.R.P.

ADVANCED RESEARCH PROJECT AGENCY NETWORK
USE : A.R.P.A.N.E.T.

ALGORITMO INTERNACIONAL DE CIFRADO DE DATOS
USE : I.D.E.A.

(3) Índice Permutado: permite el acceso por el resto de términos significativos.

Los símbolos utilizados para describir las relaciones semánticas establecidas entre los términos del Tesauro son los siguientes:
Campo Semántico: CS
Término Genérico: TG
Término Específico: TE
Término Asociado: TA
Relaciones de Equivalencia: USE, UP
Término Cabecera: TT

El manejo del Tesauro es sencillo, sin embargo, la sistematización alfabética me resulta más fácil y accesible por la comodidad de buscar por orden alfabético y no en el índice permutado, ya que requiere un mayor manejo del vocabulario informático. La presentación sistemática ofrece un esquema claro y preciso de los términos a utilizar, resultando como un tipo de mapa para manejarnos a través del lenguaje que se está estudiando.

Es muy fácil de entender gracias a la introducción y explicación del Tesauro que ofrecen.

Los términos del Tesauro no son hiperenlaces si no listas planas de conceptos.

lunes, 9 de mayo de 2011

Trabajar con Delicious

Descubrir Delicious ha sido toda una experiencia. Es una herramienta increíble para aquellas personas que solemos trabajar utilizando Internet porque te permite acceder a tus marcadores fuera de casa (sin necesidad de estar buscándolos de nuevo), poder clasificarlos mediante los tags y crear redes con personas intereses afines o con gente con la que compartir información (amigos, colegas, etc.).

He usado la cuenta de Delicious como si de mi propia cuenta se tratara, con mis marcadores reales, aunque atendiendo a las peticiones que se nos hacían, a saber: encabezamientos sólo de materia y variedad de formatos.

De ahí surgieron varios problemas como fue la necesidad de unas materias que por nuevas no existían en el catálogo y que éstas fueran más espacíficas, ya que por ello estaba perdiendo precisión. Otro es que las etiquetas sólo de materias limitan la oferta clasificadora de Delicious.

Creo que Delicious puede ser una herramienta muy útil además para una documentalista profesional, ya que Internet es una fuente de información muy importante.

Sin duda, Delicious se ha convertido en algo más que una red social y es una herramienta de trabajo que utilizo como mi propia biblioteca.

lunes, 11 de abril de 2011

¿Cuál es el futuro de los Lenguajes Documentales en el Universo 2.0?

Los lenguajes documentales son una herramienta con un potencial tremendo en la web 2.0. ya que dicha información, que se produce de una manera trepidante, necesita de herramientas para su almacenamiento y recuperación.

Sin embargo, hay que tener en cuenta que con la web 2.0. el usuario se convierte en consumidor y productor de información y la utilización de estas herramientas estarán, por tanto, no siempre en manos de profesionales de la información sino de usuarios de la web.

El papel que juegan dichos profesionales podría ser el de asisitir o diseñar herramientas que ayuden a los usuarios a utilizar los lenguajes documentales de una manera precisa y útil para que tanto infomación no se pierda y pueda ser recuperada.

Un ejemplo de ello es el etiquetado (tags) o herramientas en las redes sociales para la recuparación de infomación.