Bon, l'application fonctionne, on peut importer et mouliner des métadonnées.
Prenons un exemple, une collection d'estampes ;-)
Au départ, on a des notices au format Unimarc, pour environ 700 notices d'estampes.
On commence par exporter ça de notre SIGB préféré, au format Unimarc.
Dans Greenstone, on crée une nouvelle collection et on y importe le paquet de notices, en utilisant le plugin MARCPlug. Il va "exploser" le paquet en autant de notices que nécessaire, au format Dublin Core.
Pour que cela se passe correctement, il faut paramétrer correctement le fichier qui assure la conversion du format MARC au format Dublin Core, à savoir /usr/local/gsdl/etc/marctodc.txt
Conçu pour le format MARC21/USMARC, il doit être adapté au format Unimarc. Voici le mien à titre d'exemple :
### Coverage ###
503 -> Coverage
### Creator ###
700 -> Creator
710 -> Creator
711 -> Creator
701 -> Contributor
702 -> Contributor
703 -> Contributor
### Description ###
300 -> Description
### Identifier ###
001 -> MarcIdentifier
# 856 = "Electronic Location"
### Spécificité : récupérer le nom de fichier a partir de la cote
991 -> URL
### Language ###
546 -> MarcLanguage
### Publisher ###
210 -> Publisher
### Relation ###
305 -> Relation
### Rights ###
540 -> Rights
### Source ###
801 -> MarcSource
### Subject ###
600 -> Subject
601 -> Subject
602 -> Subject
603 -> Subject
604 -> Subject
605 -> Subject
606 -> Subject
### Title ###
200 -> Title
### Type ###
655 -> Type
### Format
215 -> Format
### References bibliographiques citant l'estampe
321 -> Source
N'étant pas un grand spécialiste de MARC, j'accepte toutes les remarques sur ce "mapping" assez approximatif.
Le passage dans la moulinette produit un fichier metadata.xml situé dans le dossier créé pour la collection. Il peut être nettoyé, arrangé, etc. avec un bon éditeur XML. Il nous a fallu supprimer des caractères diacritiques, ajouter des liens, etc. mais l'essentiel est fait.
Le reste de la configuration se passe dans l'interface graphique de Greenstone, notamment dans l'onglet "Créer", pour pouvoir afficher correctement les liens vers les images des estampes.
Je signale une astuce en passant : pour les champs répétés, très fréquents en MARC, et donc dans le fichier metadata?xml après import, il faut utiliser la balise sibling(all), telle qu'elle est décrite à la page http://wiki.greenstone.org/wiki/index.php/How_to_format_the_output_of_yo...