Das Team von EWIG, dem digitalen Langzeitarchiv des ZIB, hat ein neues Tool entwickelt, mit dem Datengebende Einrichtungen ihre Metadaten vor der Abgabe an EWIG überprüfen können:
„Best Match“ – klingt wie eine Dating-App, ist tatsächlich aber eine Daten-App! Mit der Webanwendung Best Match können ab jetzt Datenlieferungen für das von digiS und dem KOBV betriebene Langzeitarchiv EWIG (ewig.zib.de) von jeder datenliefernden Institution und vor der Übergabe an digiS bzw. das ZIB selbstständig auf Vollständigkeit überprüft werden.
Funktionsweise
Mit dem Tool ordnen die Nutzenden lokal im eigenen Browser Metadaten zu Masterdateien zu und prüfen damit zum einen ihre Datenlieferung an EWIG auf Vollständigkeit. Fehlende Masterdateien oder auch fehlende Metadaten fallen auf und können ergänzt werden. Zum anderen werden hier mögliche grundlegende Probleme wie sich wiederholende Metadatenwerte und nicht-eineindeutige Identifikatoren sichtbar. Eine vollständige Prüfung der Metadaten wird dabei zwar nicht vorgenommen. Best Match warnt jedoch, sobald Probleme gefunden werden, die eine Zuordnung verhindern könnten.
Best Match verarbeitet die Metadatenformate LIDO, EAD, CSV und Excel.
Zielgruppe
In erster Linie ist das Tool für kleinere Institutionen nützlich, die kein Digital Asset Management System o.ä. betreiben und ihre Daten nicht entsprechend der offiziellen EWIG-Spezifikation aufbereiten können. Mittels der in Best Match erzeugten Zuordnungs-Datei erstellt das EWIG-Team automatisiert METS-Container und strukturiert die Lieferung so, dass sie in den EWIG-Ingest Workflow überführt werden kann.
Vorteile
Durch die Anwendung von Best Match fallen grundlegende Probleme in den Metadaten auf (z.B. sich wiederholende Werte, nicht-eineindeutige Identifier) und können im Vorfeld einer Datenlieferung behoben werden. Bisher mussten nach Lieferung lange, oft zeitverzögert ausgetauschte Listen zu fehlenden oder unklaren Dateien und Metadaten in ständiger Kommunikation zwischen uns, den Betreiber:innen des LZA-Systems EWIG, und den datenliefernden Einrichtungen abgearbeitet werden. Best Match macht diese Probleme nun bereits beim Erstellen der Übergabedaten sichtbar.