Español (spanish formal Internacional)English (United Kingdom)

MARiMbA

MARiMbA es una herramienta orientada a bibliotecas para transformar sus registros en formato MARC (MAchine-ReadableCataloging) a RDF, siguiendo las mejores prácticas de Linked Data [1][2][3].

La herramienta soporta todo el proceso de asignación de correspondencias transformación entre los metadatos contenidos en los registros MARC y los vocabularios elegidos para generar RDF. Es una herramienta diseñada para facilitar el proceso de generación de Linked Data y permitir que sea llevado a cabo por el personal de las bibliotecas sin necesidad de asistencia técnica. Para ello, MARiMbA ofrece las siguientes características:

  • Está probada para transformar registros de autoridad y bibliográficos.
  • Todo el trabajo se realiza a través de hojas de cálculo, no siendo necesario conocer el manejo de ningún lenguaje de mapeo o transformación adicional (XML, XSLT, etc.)
  • La herramienta realiza un análisis previo de los registros a transformar, generando las plantillas para las correspondencias a partir de dicho análisis. Dichas plantillas están enfocadas a mejorar la toma de decisiones del usuario, la identificación de errores y la evaluación del proceso de transformación.
  • Permite usar cualquier vocabulario o mezcla de vocabularios en RDFS/OWL
  • Incluye un fichero de configuración que permite realizar ajustes en la transformación. En cualquier caso, viene con una configuración por defecto que sigue el modelo FRBR (Functional RequirementsforBibliographicRecords).
  • Incluye un servidor SPARQL ligero (Fuseki) que permite al usuario ejecutar

La herramienta ha sido utilizada con éxito para realizar la transformación a RDF de cerca de 7 millones de registros MARC 21 de la Biblioteca Nacional de España, y que ha dado como resultado alrededor de 60 millones de tripletas RDF. Los datos transformados son accesibles a través de SPARQL en http://datos.bne.es/sparql. Por otro lado, un ejemplo de uno de los registros transformados es accesible en la siguiente dirección: http://datos.bne.es/resource/XX1718747

¿Cómo utilizarlo?

Necesitas:

  • Registros MARC (autoridad y/o bibliográficos) en formato ISO 2709
  • Java 1.6 o superior en el path (comprueba con java -version si no estás seguro)
  • Un editor de hojas de cálculo (OpenOffice, LibreOffice, Ms Excel, etc.)

Pasos:

  1. Guardar/mover los ficheros MARC a transformar en la carpeta data. Poner los bibliográficos en la carpeta data/bibliographic y los de autoridad en data/authority. Se pueden transformar tantos ficheros como se desee.
  2. Ejecutar el comando que genera las plantillas de mapping: "marimba --generatemappings -a -b"   Esta acción genera 3 hojas de cálculo: classificationMapping y annotationMapping, relationsMapping. Además, crea una hoja de cálculo adicional, alias, que permite asignar alias a aquellas clases y propiedades RDF más usadas para evitar utilizar la URI completa. Las hojas de cálculo se encuentran por defecto en la carpeta mappings.
  3. Utilizando las hojas de cálculo generadas, asignar correspondencias entre las combinaciones encontradas en los registros MARC y las clases y propiedades de los vocabularios elegidos. Cada hoja de cálculo tiene una función definida:
    • classificationMapping: asignar la clase o tipo de recurso RDF a generar para cada una de las combinaciones.
    • annotationMapping: asignar la propiedad RDF a generar a partir de cada uno de los subcampos.
    • relationsMapping: asignar la relación RDF a establecer entre los recursos encontrados que presentan una determinada variación de subcampos.
  4. Guardar en la carpeta models los ficheros RDF de los vocabularios utilizados. Para ello necesitas descargarlos de la Web o exportarlos a un fichero si estabas usando un editor de ontologías (como NeOnToolkit o Protégé).
  5. Ejecutar el comando que genera RDF tomando las correspondencias, los registros y los vocabularios: "marimba --generaterdf -a -b --writeresultado.rdf"
  6. Si se quieren hacer consultas SPARQL directamente sobre los datos se puede ejecutar un servidor RDF ligero (Fuseki). Para ello se debe ejecutar: "run-marimba-server"

Y en la dirección http://localhost:3030/ se pueden hacer consultas sobre los datos generados

¿Interesado?

La herramienta estará disponible a principios de 2012. Sin embargo, si quiere más información o utilizar la herramienta para transformar los datos de tu institución, contacte con: Esta dirección electrónica esta protegida contra spam bots. Necesita activar JavaScript para visualizarla o Esta dirección electrónica esta protegida contra spam bots. Necesita activar JavaScript para visualizarla

 

Created under Creative Commons License - 2015 OEG.