Direkt zum Seiteninhalt springen
Beispiel aus den Akten: Das KI-Modell lernte hier am Wort „beehre“, dass diese Ansammlung von Pixeln sechs Buchstaben entspricht und wie die Kombination „b“, „h“ und „r“; aussehen könnte. Außerdem trainierte die Software unterschiedliche Varianten von „e“, die sie später in anderen Wörtern selbstständig wiedererkannte.

Beispiel aus den Akten: Das KI-Modell lernte hier am Wort beehre“, dass diese Ansammlung von Pixeln sechs Buchstaben entspricht und wie die Kombination „b“, „h“ und „r“; aussehen könnte. Außerdem trainierte die Software unterschiedliche Varianten von e“, die sie später in anderen Wörtern selbstständig wiedererkannte., Quelle: BArch, R 1001/5573, Image 0306 (Ausschnitt, bearbeitet)

Meldung

Handschriften in Kolonialakten für Nutzende lesbar gemacht

Das Bundesarchiv ermöglicht es in seinem Lesesaal in Berlin-Lichterfelde, den gesamten Inhalt der Dokumente des Reichskolonialamtes zu durchsuchen. Die unter anderem in alten Handschriften verfassten Akten wurden mittels Künstlicher Intelligenz in für Menschen und Maschinen besser lesbare Schrift übertragen. Dazu ging im Frühjahr 2021 ein Projekt zur Erstellung KI-gestützter Transkriptionen an den Start.

Bei den Akten des Bestands R 1001 Reichskolonialamt handelt es sich um die Überlieferung der zentralen Behörde des Deutschen Reichs zur Verwaltung der damaligen Kolonien. Der Bestand ist damit eine zentrale Quelle für die Aufarbeitung der deutschen Kolonialzeit. Bisher waren seine Lesbarkeit und Nutzbarkeit allerdings stark eingeschränkt, da viele enthaltene Akten in deutscher Kurrentschrift verfasst und damit für Ungeübte schwer zu lesen sind. Deshalb wurde der Bestand R 1001 Reichskolonialamt für ein Pilotprojekt zur Handschriftenerkennung im Bundesarchiv ausgewählt. Das Projekt hat mit Unterstützung von Dienstleistern die Erstellung von Transkriptionen – also buchstabengetreuen Abschriften – mittels Künstlicher Intelligenz erprobt. Ein wichtiges Ziel war es, herauszufinden, wie gut ein speziell trainiertes KI-Modell solche Texte lesen kann. Außerdem sollen die automatisch erstellten Transkriptionen öffentlich zugänglich sein.

Für das Training des KI-Modells wurden manuelle Abschriften von ca. 170 Seiten des Bestands erstellt. Anhand dieser Transkriptionen konnte das KI-Modell lernen, die einzelnen Schriftzeichen der Kurrentschrift zu erkennen, die etwa seit dem 17. bis ins frühe 20. Jahrhundert in Gebrauch war.

Nach dem erfolgreichen Training wurden mit Hilfe des KI-Modells Transkriptionen des gesamten Bestands des Reichskolonialamtes für ca. 10.000 Akten erstellt. Das Projekt konnte damit erfolgreich abgeschlossen werden.

Es ist nun möglich, in allen Dokumenten über eine Suchanwendung zu recherchieren. Zunächst steht die Anwendung im Lesesaal des Bundesarchivs in Berlin-Lichterfelde zur Verfügung und soll perspektivisch in den geplanten Digitalen Lesesaal des Bundesarchivs integriert werden. Ein Zugriff auf die Transkriptionen über das Internet direkt von zu Hause ist momentan nicht möglich.

Schritte zur Nutzung der Suchanwendung

  1. Die Buchung der Plätze für den Lesesaal Berlin-Lichterfelde erfolgt über die Terminreservierung des Benutzungszentrums.
  2. Ein aktueller und genehmigter Benutzungsantrag ist auch dann erforderlich, wenn Sie ausschließlich mit der Suchanwendung für den Bestand R 1001 arbeiten wollen. In diesem Fall genügt es aber, den Antrag an Ihrem ersten Besuchstag vor Ort einzureichen.

Zur besseren Planung bitten wir die Benutzerinnen und Benutzer außerdem, per E-Mail (siehe "Kontakt") mitzuteilen, an welchem Tag und zu welcher Uhrzeit sie mit der Suchanwendung für den Bestand R 1001 arbeiten möchten.