GRUPO DE TRABAJO |
GRUPOS DE TRABAJO |
DE COMUNICACIONES |
Lingu@net Europa: Un catálogo de recursos multilingüe con garantía de
calidad Luis
Bellido Departamento
de Ingeniería de Sistemas Telemáticos Universidad
Politécnica de Madrid Encarna
Pastor Universidad
Politécnica de Madrid Resumen Lingu@net Europa es un centro de recursos multilingüe en Internet que
ofrece acceso gratuito a un directorio de más de 1500 recursos, relacionados
con la enseñanza y el aprendizaje de unos 45 idiomas. La presente comunicación
trata sobre los aspectos más técnicos de la creación de este centro de recursos
multilingüe: catalogación y clasificación de los recursos on-line, uso de
metadatos y Dublin Core, herramientas para la catalogación y publicación, e
interfaz de usuario multilingüe. Abstract Lingu@net Europa is a multilingual
resources centre on the internet which offers free access to more than 1,500
on-line resources related to the teaching and learning of over 45 foreign
languages. This paper describes the technical aspects of the creation of this
multilingual resource centre: cataloguing and classification of on-line
resources, use of metadata, tools for cataloguing and publishing, multilingual
user interface. Introducción Lingu@net Europa es un centro de
recursos multilingüe en Internet que ofrece acceso gratuito a un directorio de
más de 1500 recursos, seleccionados no sólo en Europa, sino también en el resto del mundo, relacionados con la enseñanza y el
aprendizaje de unos 45 idiomas. Este centro ha sido desarrollado desde 1998 por
un consorcio de organizaciones académicas, educativas, de formación
profesional, culturales y tecnológicas, principalmente de Europa, y es
utilizado por más de 5000 usuarios cada mes. El reto
para el equipo de Lingu@net Europa ha sido disminuir el tiempo que profesores,
educadores, bibliotecarios, investigadores y otros profesionales de la
enseñanza de idiomas dedican a la búsqueda de recursos en Internet, mediante la
creación de un centro en el que se accede con garantías de calidad a los
recursos relevantes para sus
necesidades específicas, y con la facilidad adicional del acceso en varios
idiomas. La presente comunicación trata sobre los aspectos más técnicos de la creación de un centro de recursos multilingüe: catalogación y clasificación de los recursos, uso de metadatos, herramientas para la catalogación y publicación, e interfaz de usuario multilingüe. Catalogación
y clasificación de los recursos on-line.
Lingu@net Europa se centra en la
catalogación y clasificación de recursos on-line relacionados con
enseñanza y aprendizaje de idiomas. Un grupo de expertos del proyecto ha
identificado qué piezas de información son necesarias para disponer de una
clasificación útil para los profesionales de la enseñanza de idiomas,
proponiendo un conjunto de hasta 32 elementos que permiten una catalogación de
recursos que da soporte a la garantía de calidad. Algunos de los elementos son genéricos (autor, título, etc.)
mientras que otros son claramente específicos del campo de conocimiento objeto
del proyecto (idioma objeto de aprendizaje, sector educativo, nivel de
conocimientos, habilidades y aptitudes, etc.). Uso de metadatos y Dublin Core.
La inclusión de metadatos en
páginas web, para expresar información
que facilite la búsqueda de recursos, fue el punto de partida del proyecto para
la definición de un soporte de catalogación de recursos. Para realizar una
catalogación se hace necesario disponer de una información estructurada sobre
los objetos que se pretende catalogar. Esa es la función que cumplen los
metadatos en Lingu@net Europa. En cuanto a la semántica de los metadatos, las
definiciones aportadas por la Dublin Core Metadata Inititative (DCMI, 2002) son
aprovechadas en la medida de lo posible. Dublin Core Metadata Element Set, (DCMI, 1999) o para
simplificar, los metadatos Dublin Core,
fue el primer estándar de metadatos realizado por la DCMI. Consta de un
vocabulario semántico de 15 elementos para describir las propiedades
principales (core properties) de
objetos para sistemas basados en descubrimiento de recursos (resource discovery). Este conjunto de 15
elementos fue creado para ser utilizado por el más amplio rango de industrias y
disciplinas de estudio (LIZCANO, 2002). Muchas
comunidades utilizan los metadatos Dublin Core para describir los recursos de
sus sistemas de información. Algunas de ellas son: ·
Organizaciones educativas. ·
Bibliotecas. ·
Instituciones gubernamentales ·
Autores de páginas web. ·
Corporaciones con grandes sistemas de gestión del
conocimiento. En Lingu@net Europa, se utiliza un subconjunto de los metadatos Dublin Core, y a su vez se extiende con nuevos metadatos para dar cabida al sistema de catalogación específico para recursos de educación y aprendizaje de idiomas creado por el grupo de expertos del proyecto. A pesar de que esta extensión de los metadatos Dublin Core pueda restar interoperabilidad semántica, pues otras comunidades no conocerán el significado de los nuevos metadatos, es necesaria para proporcionar la funcionalidad requerida por los usuarios del centro de recursos. Sintaxis de representación
Uno de los objetivos por los que
surge el estándar de metadatos Dublin
Core es obtener un formato simple para el intercambio de metadatos entre
aplicaciones. Por ello, además de conocer cuál es el conjunto de términos que
se utiliza para definir los documentos (los metadatos), es necesario definir la
sintaxis de representación que permita ese intercambio de metadatos entre
aplicaciones. La mejor solución en un futuro a corto plazo consiste en utilizar
los metadatos Dublin Core como semántica y RDF (W3C, 1999) como expresión de esa semántica (LIZCANO, 2002). En
Lingu@net Europa la solución adoptada en el momento de su diseño consistió en
almacenar los metadatos Dublin Core en parejas atributo-valor en etiquetas META
dentro de los elementos HEAD de documentos HTML. Esta solución es la más
adoptada y permite a los robots utilizados para descubrimiento de recursos
(spiders, harvesters,...) encontrar la información en el propio documento HTML
y utilizar los evaluadores de expresiones HTML existentes para analizar y
extraer esa información. Lingu@net
Europa mantiene una base de datos de documentos HTML en los que se guarda la
información de los recursos relacionados con la enseñanza y el aprendizaje de
idiomas. Lingu@net Europa no guarda la información en sí, sólo la
metainformación que permite clasificar el recurso, y el URL que permite acceder
al recurso en su lugar de origen. A continuación se muestra el código de un
documento HTML con la metainformación sobre un recurso en Internet (Figura 1).
Figura 1: Código fuente de un documento de metainformación Actualmente,
la tendencia es abandonar la representación de los metadatos en HTML y optar
por una solución en la que se combine Dublín Core, XML (W3C, 2000) y RDF. Esto
permite que los recursos se puedan procesar por aplicaciones que no sólo
presenten la información, sino que también sean capaces de “entenderla” en
cierta medida. XML aporta, frente a HTML, validación del código, mayor
estructuración en los documentos, extensibilidad, internacionalización,
orientación a objetos, facilidad de intercambio de datos entre aplicaciones y
mejoras en el tratamiento de los metacontenidos. Selección
de recursos y proceso de garantía de calidad.
Un equipo de expertos en la
enseñanza y aprendizaje de idiomas es el encargado de realizar la selección de
recursos y su clasificación, utilizando para ello las herramientas puestas a su
disposición en el área de trabajo del centro virtual. Las herramientas,
desarrolladas en su mayoría en Perl, permiten la automatización de ciertas
tareas de catalogación, y dan soporte al proceso de garantía de calidad
ofreciendo dos almacenes de recursos: la “sala de espera”, donde los recursos
son clasificados y almacenados por el equipo de expertos, y la “sala de
publicación”, donde se publican los recursos una vez que un reducido grupo de
expertos los revisan y dan su visto bueno. Una vez que se valida la
catalogación realizada, los recursos son publicados y quedan accesibles
gratuitamente para los usuarios del centro virtual. La Figura 2 muestra como ejemplo la herramienta de creación de documentos de metadatos. El uso
de Perl como lenguaje de desarrollo de las herramientas ha permitido un enfoque
de prototipado rápido, con una fuerte realimentación por parte de los usuarios
del área de trabajo del centro virtual. Las herramientas se caracterizan por su
sencillez: son simples “forms” HTML, con un diseño gráfico sencillo y que
requieren por parte del usuario únicamente un cliente web (Netscape, Internet
Explorer, Mozilla,...). La
garantía de calidad se apoya en estas herramientas que permiten al equipo de expertos seleccionar
los valores para los metadatos de una manera cómoda. Además, las herramientas
fuerzan el proceso de garantía de calidad, pues este se basa en la separación
entre el “redactor” y el “editor”. El primero crea y edita el documento de
metadatos, mientras el segundo revisa los y asegura que estos sean conformes a
una serie de directivas de calidad para, finalmente, publicarlos.
Figura 2: Herramienta de creación de documentos de metadatos Una de
las ventajas que ha tenido Perl como lenguaje de programación es su potencia en
el tratamiento de cadenas de texto. Sin embargo, en la actualidad parecería más
adecuado desarrollar este tipo de herramientas usando el lenguaje de programación
Java, que dispone de un API muy potente y permite la portabilidad a distintas
plataformas hardware. Opciones
de búsqueda de recursos
Una vez decidido cuál es el
mejor sistema de catalogación de los recursos, y una vez que se ha optado por
utilizar hasta 32 campos para definir un recurso, es necesario responder a la
pregunta: ¿cómo va el usuario a encontrar el recurso que necesita? Esta
pregunta no tiene una respuesta sencilla, pues las necesidades de los usuarios
varían: desde el usuario curioso que desea “echar un vistazo” para ver qué
recursos se pueden encontrar, hasta el usuario con unas necesidades muy
concretas, por ejemplo, un profesor de inglés que busca un vídeo (en inglés)
sobre microbiología como material de soporte para sus clases a un grupo de
biólogos. La
solución adoptada en Lingu@net Europa consiste en ofrecer tres posibilidades
distintas para el acceso de recursos: navegación, búsqueda guiada y búsqueda
libre. La navegación permite acceder a los recursos seleccionando una serie de
valores clave: ámbito educativo, tipo de recurso, e idioma objeto de
aprendizaje, y permite con sólo tres pulsaciones de ratón, acceder a la lista
de recursos que satisfacen los valores elegidos para dichos campos. La búsqueda
guiada permite el acceso a los recursos mediante la selección de los valores
para un conjunto más amplio de campos, que son mostrados al usuario mediante
menús desplegables. La búsqueda libre permite por último al usuario introducir
uno o varios términos cualquiera, y obtener los recursos que se correspondan
con dichos términos. Desde el
punto de vista técnico, las distintas opciones de búsqueda de recursos se basan
en la existencia de un índice de los documentos de metadatos. Dicho índice se
actualiza cada vez que se publica un nuevo documento de metadatos, y permite la
realización de búsquedas basándose en los valores de las etiquetas META y
también búsquedas de cualquier palabra que aparece en los documentos de
metadatos. Interfaz
de usuario multilingüe
Uno de los aspectos más
importantes para el éxito o el fracaso
un centro virtual de este tipo es su interfaz de usuario. En el caso de
Lingu@net Europa, la interfaz de usuario ha evolucionado desde un primer
prototipo con una interfaz relativamente sencilla, principalmente textual,
hasta una interfaz mucho más rica desde el punto de vista gráfico, y en la cuál
se aprecia la influencia de los denominados “portales” de Internet. El número
de idiomas soportados ha evolucionado también, pasando de cuatro, inglés,
francés, alemán y holandés, a seis, con la inclusión del español y el italiano.
Figura 3: Página pública de Lingu@net Europa El
diseño gráfico actual de las páginas públicas de Lingu@net Europa (Figura 3) ha sido el fruto de un intenso trabajo por parte de
los socios del proyecto, asesorado por un diseñador gráfico experto en
interfaces web. Las
páginas de Lingu@net Europa se generan dinámicamente, utilizando un conjunto de
bibliotecas en Perl diseñadas específicamente para el proyecto, pero de uso
general. Dichas bibliotecas permiten crear las páginas a partir de distintos
módulos, como por ejemplo, el módulo barra_superior,
el módulo botones_de_la_izquierda,
etc. Además, se han definido una serie de etiquetas de escape que aportan mayor
flexibilidad a los módulos. Cada etiqueta lleva asociada una acción, y el
resultado de dicha acción se inserta automáticamente en el punto del documento
correspondiente (FERRER, 2001) Las etiquetas
de escape facilitan la creación del interfaz en distintos idiomas. Por ejemplo, se definen etiquetas para insertar ficheros dependientes del
idioma de navegación del usuario, o etiquetas que permiten traducir un término
en inglés por el término correspondiente en el idioma de navegación del
usuario. En este
punto es conveniente aclarar el funcionamiento, desde el punto de vista de los
idiomas, del conjunto de valores de los metadatos utilizados en Lingu@net
Europa. La definición de los valores se ha realizado en inglés por un equipo de
expertos del proyecto, tras lo cual se ha realizado su traducción a los
distintos idiomas del centro virtual. El proceso ha requerido una fase
posterior de refinamiento, pues algunos de los términos en inglés no tienen un
único equivalente en otros idiomas y viceversa. En este sentido son
interesantes los trabajos de indexación semántica (VERDEJO, 2000), que
presentan una posible solución al problema del uso del inglés (u otro idioma)
como base para la generación de términos en otros idiomas. Finalmente,
una vez acordados los términos, estos se introducen en un tesauro que relaciona
los términos en inglés con los términos en otros idiomas. De esta forma, es
posible crear gran parte del diseño web (los módulos) en un único idioma y
utilizar las etiquetas de traducción que se basan en el tesauro para generar
automáticamente las páginas en el resto de idiomas. Conclusiones
Se han presentado las soluciones
adoptadas en Lingu@net Europa para resolver los problemas que presenta la
creación y mantenimiento de un catalogo multilingüe de recursos en Internet. A
pesar de estar enfocado a un campo específico (los recursos educativos y
formativos para idiomas), se ha buscado una solución lo más general posible.
También se han presentado soluciones alternativas, disponibles hoy en día o en
un futuro cercano (Java frente a Perl, Dublín Core/RDF/XML frente a Dublín
Core/HTML) que facilitarían gran parte del trabajo desarrollado en Lingu@net
Europa y permitirían la creación de un centro virtual más flexible y escalable. Agradecimientos
Lingu@net Europa fue
desarrollado inicialmente como un proyecto europeo (1998-2001), con el apoyo
financiero de la Comisión Europea (Dirección General de Educación y Cultura).
En la actualidad opera como una compañía sin ánimo de lucro que está abierta a
la entrada de nuevos socios y miembros, tanto de Europa como del resto del
mundo. Referencias
CILT,
Centre for Information on Language Teaching and Research, UK, http://www.cilt.org.uk CVC, Centro Virtual Cervantes, http://cvc.cervantes.es/ DCMI,
1999, Dublin Core Metadata Element Set, Version 1.1, http://dublincore.org/documents/dces/ DCMI,
2002, Dublin Core Metadata Initiative, http://dublincore.org FERRER, Adrián, 2001, Gestión de Documentos para un
Centro Virtual Multilingüe, Proyecto Fin de Carrera, ETSI de Telecomunicación
de Madrid. Lingu@net Europa, http://www.linguanet-europa.org/ LIZCANO, Alejandro, 2002, Integración de
Tecnologías XML y Java para Gestión de Sistemas de Información, Proyecto Fin de
Carrera, ETSI de Telecomunicación de Madrid. IMS Global Learning
Consortium, 2002, IMS Specifications, http://www.imsproject.org/specifications.html VERDEJO, Felisa, Gonzalo, Julio,
Fernández , David, Peñas , Anselmo, López,
Fernando, 2000, “ITEM: Un Motor de Búsqueda Multilingüe Basado en Indexación
Semántica”, I Jornadas Españolas de Bibliotecas Digitales, Valladolid, http://gaia.dcs.fi.uva.es/~jbidi2000/comunicaciones/13_item.pdf W3C,
1999, Resource Description Framework (RDF) Model and Syntax Specification, W3C
Recommendation, http://www.w3.org/TR/REC-rdf-syntax/ W3C, 2000, Extensible Markup Language (XML) 1.0
(Second Edition), W3C Recommendation, http://www.w3.org/TR/2000/REC-xml-20001006
|