VERSIÓN
PDF
INFORMACIÓN DEL
GRUPO DE TRABAJO
LISTA DE
GRUPOS DE TRABAJO
LISTA COMPLETA
DE COMUNICACIONES


CULTURA & POLÍTICA @ CIBERESPACIO

 

1er Congreso ONLINE del Observatorio para la CiberSociedad

 

Comunicaciones – Grupo 2

Catalogación de Recursos de Internet: Criterios, sistemas y soportes

 

Coordinación: José Ignacio Sánchez de Villapadierna y Luis Bellido Triana (js.villapadierna@cervantes.es)

 

http://www.cibersociedad.net/congreso

 

 

Lingu@net Europa: Un catálogo de recursos

 multilingüe con garantía de calidad

 

 

Luis Bellido

Departamento de Ingeniería de Sistemas Telemáticos

Universidad Politécnica de Madrid

lbellido@dit.upm.es

 

Encarna Pastor
Departamento de Ingeniería de Sistemas Telemáticos

Universidad Politécnica de Madrid

epastor@dit.upm.es

 

 

Resumen

Lingu@net Europa es un centro de recursos multilingüe en Internet que ofrece acceso gratuito a un directorio de más de 1500 recursos, relacionados con la enseñanza y el aprendizaje de unos 45 idiomas. La presente comunicación trata sobre los aspectos más técnicos de la creación de este centro de recursos multilingüe: catalogación y clasificación de los recursos on-line, uso de metadatos y Dublin Core, herramientas para la catalogación y publicación, e interfaz de usuario multilingüe.

 

Abstract

Lingu@net Europa is a multilingual resources centre on the internet which offers free access to more than 1,500 on-line resources related to the teaching and learning of over 45 foreign languages. This paper describes the technical aspects of the creation of this multilingual resource centre: cataloguing and classification of on-line resources, use of metadata, tools for cataloguing and publishing, multilingual user interface.

 


Introducción

 

Lingu@net Europa es un centro de recursos multilingüe en Internet que ofrece acceso gratuito a un directorio de más de 1500 recursos, seleccionados no sólo en Europa, sino también en  el resto del mundo,  relacionados con la enseñanza y el aprendizaje de unos 45 idiomas. Este centro ha sido desarrollado desde 1998 por un consorcio de organizaciones académicas, educativas, de formación profesional, culturales y tecnológicas, principalmente de Europa, y es utilizado por más de 5000 usuarios cada mes.

 

El reto para el equipo de Lingu@net Europa ha sido disminuir el tiempo que profesores, educadores, bibliotecarios, investigadores y otros profesionales de la enseñanza de idiomas dedican a la búsqueda de recursos en Internet, mediante la creación de un centro en el que se accede con garantías de calidad a los recursos relevantes para  sus necesidades específicas, y con la facilidad adicional del acceso en varios idiomas.

 

La presente comunicación trata sobre los aspectos más técnicos de la creación de un centro de recursos multilingüe: catalogación y clasificación de los recursos, uso de metadatos, herramientas para la catalogación y publicación, e interfaz de usuario multilingüe.

 

 

Catalogación y clasificación de los recursos on-line.

 

Lingu@net Europa se centra en la catalogación y clasificación de recursos on-line relacionados con enseñanza y aprendizaje de idiomas. Un grupo de expertos del proyecto ha identificado qué piezas de información son necesarias para disponer de una clasificación útil para los profesionales de la enseñanza de idiomas, proponiendo un conjunto de hasta 32 elementos que permiten una catalogación de recursos que da soporte a la garantía de calidad.  Algunos de los elementos son genéricos (autor, título, etc.) mientras que otros son claramente específicos del campo de conocimiento objeto del proyecto (idioma objeto de aprendizaje, sector educativo, nivel de conocimientos, habilidades y aptitudes, etc.).

 

 

Uso de metadatos y Dublin Core.

 

La inclusión de metadatos en páginas  web, para expresar información que facilite la búsqueda de recursos, fue el punto de partida del proyecto para la definición de un soporte de catalogación de recursos. Para realizar una catalogación se hace necesario disponer de una información estructurada sobre los objetos que se pretende catalogar. Esa es la función que cumplen los metadatos en Lingu@net Europa. En cuanto a la semántica de los metadatos, las definiciones aportadas por la Dublin Core Metadata Inititative (DCMI, 2002) son aprovechadas en la medida de lo posible.

Dublin Core Metadata Element Set, (DCMI, 1999) o para simplificar, los metadatos Dublin Core, fue el primer estándar de metadatos realizado por la DCMI. Consta de un vocabulario semántico de 15 elementos para describir las propiedades principales (core properties) de objetos para sistemas basados en descubrimiento de recursos (resource discovery). Este conjunto de 15 elementos fue creado para ser utilizado por el más amplio rango de industrias y disciplinas de estudio (LIZCANO, 2002).

 

Muchas comunidades utilizan los metadatos Dublin Core para describir los recursos de sus sistemas de información. Algunas de ellas son:

·         Organizaciones educativas.

·         Bibliotecas.

·         Instituciones gubernamentales

·         Autores de páginas web.

·         Corporaciones con grandes sistemas de gestión del conocimiento.

En Lingu@net Europa, se utiliza un subconjunto de los metadatos Dublin Core, y a su vez se extiende con nuevos metadatos para dar cabida al sistema de catalogación específico para recursos de educación y aprendizaje de idiomas creado por el grupo de expertos del proyecto. A pesar de que esta extensión de los metadatos Dublin Core pueda restar interoperabilidad semántica, pues otras comunidades no conocerán el significado de los nuevos metadatos,  es necesaria para proporcionar la funcionalidad requerida por los usuarios del centro de recursos.

 

 

Sintaxis de representación

 

Uno de los objetivos por los que surge el estándar de metadatos Dublin Core es obtener un formato simple para el intercambio de metadatos entre aplicaciones. Por ello, además de conocer cuál es el conjunto de términos que se utiliza para definir los documentos (los metadatos), es necesario definir la sintaxis de representación que permita ese intercambio de metadatos entre aplicaciones. La mejor solución en un futuro a corto plazo consiste en utilizar los metadatos Dublin Core como semántica y RDF (W3C, 1999) como expresión  de esa semántica (LIZCANO, 2002).

 

En Lingu@net Europa la solución adoptada en el momento de su diseño consistió en almacenar los metadatos Dublin Core en parejas atributo-valor en etiquetas META dentro de los elementos HEAD de documentos HTML. Esta solución es la más adoptada y permite a los robots utilizados para descubrimiento de recursos (spiders, harvesters,...) encontrar la información en el propio documento HTML y utilizar los evaluadores de expresiones HTML existentes para analizar y extraer esa información. 

 

Lingu@net Europa mantiene una base de datos de documentos HTML en los que se guarda la información de los recursos relacionados con la enseñanza y el aprendizaje de idiomas. Lingu@net Europa no guarda la información en sí, sólo la metainformación que permite clasificar el recurso, y el URL que permite acceder al recurso en su lugar de origen. A continuación se muestra el código de un documento HTML con la metainformación sobre un recurso en Internet (Figura 1).

 

<HTML><HEAD><TITLE>Resource: http://cvc.cervantes.es/aula/didactiteca/</TITLE>

<META NAME="DC.Creator" CONTENT="Centro Virtual Cervantes, varios autores">

<META NAME="DC.Title" CONTENT="Didactiteca">

<META NAME="DC.Date.Created" CONTENT="2000--">

<META NAME="DC.Date.X-MetadataCreated" CONTENT="2001-03-28">

<META NAME="DC.Publisher" CONTENT="Centro Virtual Cervantes">

<META NAME="DC.Publisher.X-Email" CONTENT="cvc@cervantes.es">

<META NAME="DC.Coverage.Placename" CONTENT="Spain">

<META NAME="LING.ResourceLocation" CONTENT="Education and training">

<META NAME="DC.Type" CONTENT="Teaching and learning materials; Exercises and Tasks">

<META NAME="LING.SourceLanguage" CONTENT="Spanish">

<META NAME="LING.TargetLanguage" CONTENT="Spanish">

<META NAME="LING.EducationalSector" CONTENT="Secondary education; Further education;

 Higher education; Teacher training">

<META NAME="LING.VocationalSector" CONTENT="Art and Design; Business and Administrat

ion (includes Management); Education; Financial Services (includes Accounting, Banki

ng, Insurance); Hospitality and Catering; Leisure and Tourism (includes Sport)">

<META NAME="LING.ProficiencyLevel" CONTENT="Beginner; Intermediate; Advanced">

<META NAME="LING.Skills" CONTENT="Reading; Writing; Listening; Speaking; Grammar; Vo

cabulary; Pronunciation; Spelling">

<META NAME="LING.Content.Assessment" CONTENT="">

<META NAME="LING.Content.Methodology" CONTENT="Methodology; Audiovisual aids; Authen

tic materials; Communicative language teaching; Creative activities; Games; Informat

ion and Communication Technology; Songs; Textbooks; Video">

<META NAME="LING.Content.Learners" CONTENT="Learners; Learner attitudes; Learning st

rategies; Motivation">

<META NAME="LING.Content.Organisation" CONTENT="Organisation and planning; Curriculu

m development">

<META NAME="LING.Content.Topics" CONTENT="">

<META NAME="DC.Description" CONTENT="Importante archivo de actividades con técnicas

pedagógicas, propuestas didácticas y consejos para el profesor de E/LE">

<META NAME="DC.Description.Language" CONTENT="Spanish">

<META NAME="LING.UserComments" CONTENT="">

<META NAME="LING.RightsOfUse" CONTENT="Refer to resource provider">

<META NAME="DC.Format.X-Size" CONTENT="not known">

<META NAME="DC.Format" CONTENT="text/html">

<META NAME="DC.Format.X-Requirements" CONTENT="standard browser">

<META NAME="DC.Identifier" CONTENT="http://cvc.cervantes.es/aula/didactiteca/">

<META NAME="LING.AccessionNumber" CONTENT="1039">

<META NAME="LING.Approver1" CONTENT="CERVANTES.Sánchez.2001-03-28">

<META NAME="LING.Cataloguer" CONTENT="CERVANTES.Sánchez.2001-03-28">

<META NAME="LING.MetadataInputBy" CONTENT="CERVANTES.Sánchez.2001-03-28">

<META NAME="LING.X-MetadataLastModified" CONTENT="CERVANTES.Sánchez.2001-05-22">

<META NAME="LING.AuthorisedReady" CONTENT="BDP.Venturi.2001-05-22">

</HEAD><BODY></BODY></HTML>

Figura 1: Código fuente de un documento de metainformación

 

Actualmente, la tendencia es abandonar la representación de los metadatos en HTML y optar por una solución en la que se combine Dublín Core, XML (W3C, 2000) y RDF. Esto permite que los recursos se puedan procesar por aplicaciones que no sólo presenten la información, sino que también sean capaces de “entenderla” en cierta medida. XML aporta, frente a HTML, validación del código, mayor estructuración en los documentos, extensibilidad, internacionalización, orientación a objetos, facilidad de intercambio de datos entre aplicaciones y mejoras en el tratamiento de los metacontenidos.

 

 

Selección de recursos y proceso de garantía de calidad.

 

Un equipo de expertos en la enseñanza y aprendizaje de idiomas es el encargado de realizar la selección de recursos y su clasificación, utilizando para ello las herramientas puestas a su disposición en el área de trabajo del centro virtual. Las herramientas, desarrolladas en su mayoría en Perl, permiten la automatización de ciertas tareas de catalogación, y dan soporte al proceso de garantía de calidad ofreciendo dos almacenes de recursos: la “sala de espera”, donde los recursos son clasificados y almacenados por el equipo de expertos, y la “sala de publicación”, donde se publican los recursos una vez que un reducido grupo de expertos los revisan y dan su visto bueno. Una vez que se valida la catalogación realizada, los recursos son publicados y quedan accesibles gratuitamente para los usuarios del centro virtual. La Figura 2 muestra como ejemplo la  herramienta de creación de documentos de metadatos.

 

El uso de Perl como lenguaje de desarrollo de las herramientas ha permitido un enfoque de prototipado rápido, con una fuerte realimentación por parte de los usuarios del área de trabajo del centro virtual. Las herramientas se caracterizan por su sencillez: son simples “forms” HTML, con un diseño gráfico sencillo y que requieren por parte del usuario únicamente un cliente web (Netscape, Internet Explorer, Mozilla,...). 

 

La garantía de calidad se apoya en estas herramientas que  permiten al equipo de expertos seleccionar los valores para los metadatos de una manera cómoda. Además, las herramientas fuerzan el proceso de garantía de calidad, pues este se basa en la separación entre el “redactor” y el “editor”. El primero crea y edita el documento de metadatos, mientras el segundo revisa los y asegura que estos sean conformes a una serie de directivas de calidad para, finalmente, publicarlos.

Figura 2: Herramienta de creación de documentos de metadatos

 

Una de las ventajas que ha tenido Perl como lenguaje de programación es su potencia en el tratamiento de cadenas de texto. Sin embargo, en la actualidad parecería más adecuado desarrollar este tipo de herramientas usando el lenguaje de programación Java, que dispone de un API muy potente y permite la portabilidad a distintas plataformas hardware.

 

 

Opciones de búsqueda de recursos

 

Una vez decidido cuál es el mejor sistema de catalogación de los recursos, y una vez que se ha optado por utilizar hasta 32 campos para definir un recurso, es necesario responder a la pregunta: ¿cómo va el usuario a encontrar el recurso que necesita? Esta pregunta no tiene una respuesta sencilla, pues las necesidades de los usuarios varían: desde el usuario curioso que desea “echar un vistazo” para ver qué recursos se pueden encontrar, hasta el usuario con unas necesidades muy concretas, por ejemplo, un profesor de inglés que busca un vídeo (en inglés) sobre microbiología como material de soporte para sus clases a un grupo de biólogos.

 

La solución adoptada en Lingu@net Europa consiste en ofrecer tres posibilidades distintas para el acceso de recursos: navegación, búsqueda guiada y búsqueda libre. La navegación permite acceder a los recursos seleccionando una serie de valores clave: ámbito educativo, tipo de recurso, e idioma objeto de aprendizaje, y permite con sólo tres pulsaciones de ratón, acceder a la lista de recursos que satisfacen los valores elegidos para dichos campos. La búsqueda guiada permite el acceso a los recursos mediante la selección de los valores para un conjunto más amplio de campos, que son mostrados al usuario mediante menús desplegables. La búsqueda libre permite por último al usuario introducir uno o varios términos cualquiera, y obtener los recursos que se correspondan con dichos términos.

 

Desde el punto de vista técnico, las distintas opciones de búsqueda de recursos se basan en la existencia de un índice de los documentos de metadatos. Dicho índice se actualiza cada vez que se publica un nuevo documento de metadatos, y permite la realización de búsquedas basándose en los valores de las etiquetas META y también búsquedas de cualquier palabra que aparece en los documentos de metadatos.

 

 

Interfaz de usuario multilingüe

 

Uno de los aspectos más importantes para el éxito o el fracaso  un centro virtual de este tipo es su interfaz de usuario. En el caso de Lingu@net Europa, la interfaz de usuario ha evolucionado desde un primer prototipo con una interfaz relativamente sencilla, principalmente textual, hasta una interfaz mucho más rica desde el punto de vista gráfico, y en la cuál se aprecia la influencia de los denominados “portales” de Internet. El número de idiomas soportados ha evolucionado también, pasando de cuatro, inglés, francés, alemán y holandés, a seis, con la inclusión del español y el italiano.

 

Figura 3: Página pública de Lingu@net Europa

 

El diseño gráfico actual de las páginas públicas de Lingu@net Europa (Figura 3) ha sido el fruto de un intenso trabajo por parte de los socios del proyecto, asesorado por un diseñador gráfico experto en interfaces web.

 

Las páginas de Lingu@net Europa se generan dinámicamente, utilizando un conjunto de bibliotecas en Perl diseñadas específicamente para el proyecto, pero de uso general. Dichas bibliotecas permiten crear las páginas a partir de distintos módulos, como por ejemplo, el módulo barra_superior, el módulo botones_de_la_izquierda, etc. Además, se han definido una serie de etiquetas de escape que aportan mayor flexibilidad a los módulos. Cada etiqueta lleva asociada una acción, y el resultado de dicha acción se inserta automáticamente en el punto del documento correspondiente (FERRER, 2001)

 

Las etiquetas de escape facilitan la creación del interfaz en distintos idiomas.  Por ejemplo, se definen etiquetas  para insertar ficheros dependientes del idioma de navegación del usuario, o etiquetas que permiten traducir un término en inglés por el término correspondiente en el idioma de navegación del usuario.

 

En este punto es conveniente aclarar el funcionamiento, desde el punto de vista de los idiomas, del conjunto de valores de los metadatos utilizados en Lingu@net Europa. La definición de los valores se ha realizado en inglés por un equipo de expertos del proyecto, tras lo cual se ha realizado su traducción a los distintos idiomas del centro virtual. El proceso ha requerido una fase posterior de refinamiento, pues algunos de los términos en inglés no tienen un único equivalente en otros idiomas y viceversa. En este sentido son interesantes los trabajos de indexación semántica (VERDEJO, 2000), que presentan una posible solución al problema del uso del inglés (u otro idioma) como base para la generación de términos en otros idiomas.

 

Finalmente, una vez acordados los términos, estos se introducen en un tesauro que relaciona los términos en inglés con los términos en otros idiomas. De esta forma, es posible crear gran parte del diseño web (los módulos) en un único idioma y utilizar las etiquetas de traducción que se basan en el tesauro para generar automáticamente las páginas en el resto de idiomas.

 

 

Conclusiones

 

Se han presentado las soluciones adoptadas en Lingu@net Europa para resolver los problemas que presenta la creación y mantenimiento de un catalogo multilingüe de recursos en Internet. A pesar de estar enfocado a un campo específico (los recursos educativos y formativos para idiomas), se ha buscado una solución lo más general posible. También se han presentado soluciones alternativas, disponibles hoy en día o en un futuro cercano (Java frente a Perl, Dublín Core/RDF/XML frente a Dublín Core/HTML) que facilitarían gran parte del trabajo desarrollado en Lingu@net Europa y permitirían la creación de un centro virtual más flexible y escalable.

 

 

Agradecimientos

 

Lingu@net Europa fue desarrollado inicialmente como un proyecto europeo (1998-2001), con el apoyo financiero de la Comisión Europea (Dirección General de Educación y Cultura). En la actualidad opera como una compañía sin ánimo de lucro que está abierta a la entrada de nuevos socios y miembros, tanto de Europa como del resto del mundo.

 

 

 

Referencias

 

CILT, Centre for Information on Language Teaching and Research, UK, http://www.cilt.org.uk

CVC, Centro Virtual Cervantes, http://cvc.cervantes.es/

DCMI, 1999, Dublin Core Metadata Element Set, Version 1.1, http://dublincore.org/documents/dces/

DCMI, 2002, Dublin Core Metadata Initiative, http://dublincore.org

FERRER, Adrián, 2001, Gestión de Documentos para un Centro Virtual Multilingüe, Proyecto Fin de Carrera, ETSI de Telecomunicación de Madrid.

Lingu@net Europa, http://www.linguanet-europa.org/

LIZCANO, Alejandro, 2002, Integración de Tecnologías XML y Java para Gestión de Sistemas de Información, Proyecto Fin de Carrera, ETSI de Telecomunicación de Madrid.

IMS Global Learning Consortium, 2002, IMS Specifications, http://www.imsproject.org/specifications.html

VERDEJO, Felisa, Gonzalo, Julio, Fernández , David, Peñas , Anselmo, López, Fernando, 2000, “ITEM: Un Motor de Búsqueda Multilingüe Basado en Indexación Semántica”, I Jornadas Españolas de Bibliotecas Digitales, Valladolid, http://gaia.dcs.fi.uva.es/~jbidi2000/comunicaciones/13_item.pdf

W3C, 1999, Resource Description Framework (RDF) Model and Syntax Specification, W3C Recommendation, http://www.w3.org/TR/REC-rdf-syntax/

W3C, 2000, Extensible Markup Language (XML) 1.0 (Second Edition), W3C Recommendation, http://www.w3.org/TR/2000/REC-xml-20001006



(c) 1er Congreso ONLINE del Observatorio para la CiberSociedad
(c) Observatorio para la CiberSociedad
(c) Del autor
Volver a la página inicial del Observatorio para la CiberSociedad