Hauptnavigation

Data Preparation Tool (DPT 2.0.14) - Werkzeug zur Datenvorbereitung

Konvertierung lokaler Daten in die Formate des Archivportals Europa


© APEx-Projekt

Das Hauptanliegen des Archivportals Europa ist es, einen nahtlosen Zugang zu verschiedenen archivischen Quellen aus ganz Europa zu ermöglichen. Aus diesem Grund wurden in den Projekten zum Auf- und Ausbau des Archivportals Europa, dem APEnet-Projekt und dem APEx-Projekt, drei gemeinsame europäische XML Schemata entwickelt. Das apeEAD Format für Erschließungsinformationen, wie Findbücher und Beständeübersichten, dient als Basis für alle zentralen Datenverarbeitungsprozesse und ermöglicht zudem, standardisierte archivische Daten aus dem Archivportal Europa an spartenübergreifende Portal Europeana zu liefern. Das apeEAC-CPF Format ist das gemeinsame Austauschformat für Informationen zu Provenienzen und Herkunftsstellen von Archivgut, wie Personen, Familien oder Körperschaften. Das Format EAG 2012 ist die gemeinsame Grundlage für die Beschreibung archivischer Einrichtungen. Die drei Formate bilden die Basis des Konvertierungs- und Validierungsprozesses innerhalb der nachfolgend zum Download bereitgestellten Software.

Die angebotene Konvertierungssoftware (engl. Data Preparation Tool) baut auf internationalen archivischen Standards auf und hat diese mit den oben genannten spezifizierten Profilen implementiert. Neben EAD (Encoded Archival Description) und ISAD(G) werden auch die Standards EAC-CPF (Encoded Archival Context-Corporations, Persons, Families, basierend auf ISAAR-CPF) zur Beschreibung der Herkunftsstellen sowie EAG (Encoded Archival Guide) und ISDIAH zur Beschreibung der archivischen Einrichtungen selbst berücksichtigt. Weitere Informationen zur Verwendung dieser archivischen Standards innerhalb des Archivportals Europa finden Sie auf der internationalen Webseite des APEx-Projekts in der Kategorie "Outcomes > Standards".

Das Werkzeug zur Datenaufbereitung erlaubt den am Projekt beteiligten Archiven, eigene Daten in die gemeinsam genutzten Formate apeEAD, apeEAC-CPF und EAG 2012 zu konvertieren, bevor sie anschließend in das Portal importiert werden. Dabei können sowohl lokal verwendete Dateien als auch Exportformate aus standard-konformen Datenbanken verarbeitet werden. Des Weiteren können alle Institutionen, die an der Teilnahme am Archivportal Europa interessiert sind, die Software lokal testen und damit überprüfen, wie ihre Daten nach einer Konvertierung aussehen.

 

Funktionalitäten der Konvertierungssoftware

Im Einzelnen bietet die Software zur Zeit folgende Funktionalitäten, die unabhängig voneinander genutzt werden können:

  • Sie können prüfen, ob Ihre lokalen EAD-Dateien mit EAD 2002 konform sind (validieren);
  • Sie können eigene Schemadateien importieren und prüfen, ob Ihre Daten valide sind;
  • Sie können Ihre Dateien nach apeEAD konvertieren und so eine mögliche Teilnahme am Projekt oder den Ablauf evaluieren (z.B. Nutzen eines eigenen XSLT Konvertierungsskripts innerhalb des Tools);
  • Sie können eine mehrstufige Beständeübersicht erstellen, die auf Ihren Findbüchern basiert;
  • Sie können Ihre nach apeEAD umgewandelten Daten weiter nach EDM, das von Europeana verwendete Datenformat konvertieren und somit eine Datenlieferung an Europeana vorbereiten;
  • Sie können eine vorhanden EAC-CPF Datei nach apeEAC-CPF konvertieren;
  • Sie können eine apeEAC-CPF-Datei erstellen, um Provenienzen zu Ihren Beständen zu beschreiben;
  • Sie können eine EAG-Datei erstellen sowie eine vorhandene EAG-Datei bearbeiten, um Ihre Institution zu beschreiben;
  • Sie können alle mit der Software erstellten XML-Dateien (apeEAD, EDM, apeEAC-CPF, EAG 2012) herunterladen und lokal verwenden.

Im Projekt APEx wurde im August 2012 ein Bericht zu EAG 2012 für die EU-Kommission fertig gestellt, das in Zusammenarbeit mit den Projektpartnern erarbeitet wurde und das bisherige EAG, bzw. die Version aus dem Jahr 2002, ersetzt. Den Bericht, das Schema, die im Archivportal Europa verwendete Spezifikation von EAG 2012 und weitere Informationen sind auf der internationalen APEx-Projektseite verfügbar. Ein Formular zur Erstellung und zur Bearbeitung von EAG-Dateien wurden in die Konvertierungssoftware integriert.

Im September 2014 wurde im Archivportal Europa der Standard EAC-CPF implementiert. Das aktuelle apeEAC-CPF Schema wurde ist auf der internationalen APEx-Projektseite veröffentlicht. Neben der Konvertierung von EAC-CPF-Dateien nach apeEAC-CPF bietet die Konvertierungssoftware ein Formular zur Erstellung von apeEAC-CPF-Dateien an. Das Formular enthält eine Auswahl der möglichen Felder.

Ein apeMETS-Schema, d.h. ein eigenes Profil vom METS für die Verwendung im Archivportal Europa, wurde auf der internationalen APEx-Projektseite veröffentlicht. Der Umfang und der Zeitplan für die Implementierung von apeMETS in das Portal wird derzeit diskutiert.

Das APEx-Projekt ist durch seine Partner aktiv an der Diskussion um die Revision des Standards EAD aus dem Jahr 2002 beteiligt. Die Veröffentlichung der neuen Version, EAD3, ist für den Winter 2014/2015 geplant. Das apeEAD Schema sowie die damit verbundenen Konvertierungsskripte werden schnellstmöglich an das neue EAD Schema angepasst.

 

Download:

Handbuch v1.3 zum Data Preparation Tool (Deutsch, pdf) (pdf, ~1002.49KB)

Wir empfehlen Ihnen, vor dem Download und vor ersten Tests mit der Software, das begleitende Handbuch zu lesen. Die Software steht zurzeit in Englisch, Deutsch, Französisch, Griechisch, Niederländisch und Ungarisch zur Verfügung. Das Handbuch wird laufend aktualisiert.

Voraussetzung für die Nutzung des DPT ist Java 7 oder eine jüngere Java Version.

ACHTUNG: Das DPT ist bislang nicht mit Java 8 kompatibel.

Generell ist die Software Open Source und steht Ihnen somit frei zur Verfügung. Wir weisen Sie jedoch darauf hin, dass: