Old German Handwriting Transcription
Crafted by a von Pfeilitzer-Franck Descendant


mein Name ist Artjom Wassiljew und ich bin von Beruf Industrie-Journalist. Seit mehr als 15 Jahren beschäftige ich mich jedoch parallel mit deutschsprachigen Archivdokumenten – zunächst im Rahmen meiner eigenen genealogischen Forschung, später auch für andere interessierte Menschen. Mein Forschungsschwerpunkt und mein geographisches Arbeitsfeld umfassen vor allem die Archive der baltischen Länder – Lettland, Estland, Litauen – sowie Deutschlands.
Hier und heute biete ich Ihnen jedoch keine Archiv-Recherchedienstleistungen an, sondern die Transkription – also die Entzifferung handschriftlicher Dokumente in alter deutscher Schrift (Kurrentschrift, Sütterlin). Diese sogenannten „gotischen“ Schriften sind selbst für Muttersprachler oft schwer lesbar, da sich die historische Kalligrafie deutlich von der heute gebräuchlichen unterscheidet. Die Dokumente, die ich für Sie transkribieren kann, stammen aus staatlichen oder behördlichen Archiven – oder aus Ihrem Familienbesitz.
die Ihre Vorfahren an verschiedene Institutionen stellten und dabei ihre Lebensumstände schilderten
die oft spannende Episoden mit Beteiligung Ihrer Verwandten enthalten und sogar deren Charakterzüge offenbaren können
bei denen Ihre Vorfahren eine offizielle Bestätigung ihres Standes beantragten
wie Kaufverträge oder Inventarlisten, die interessante Einblicke in den Alltag und die Wirtschaft Ihrer Familie bieten können
aus Schul-, Militär- oder Zivildienstzeiten Ihrer Vorfahren
und vieles mehr.
Eine Ausnahme gibt es: Ich übernehme keine Transkription von kurzen, einzelnen Einträgen aus Kirchenbüchern (z.B. Taufen, Konfirmationen, Trauungen, Sterbefälle). Für solche Fälle finden Sie kostenlose Hilfe von Freiwilligen – suchen Sie einfach nach „German Transcription“ auf Facebook und stellen Sie Ihre Anfrage in den entsprechenden Gruppen. Wenn Sie jedoch eine umfangreichere Transkription (eine ganze Seite Fließtext, mehrere oder zahlreiche Dokumentenseiten) benötigen, können Sie sich gerne an mich wenden.
Am Ende jedes Kalenderjahres nehme ich mir einen ganzen Tag Zeit, um die jeweils aktuellen maschinellen und KI-Lösungen gezielt für die Transkription deutscher Kurrentschrift zu testen. Ich probiere alle auf dem Markt verfügbaren Modelle aus – grundsätzlich in den Bezahlversionen, also mit vollem Funktionsumfang. Ich messe die Fehlerquote und die Zeit, die für Upload, Verarbeitung und Strukturierung der Ergebnisse draufgeht, und vor allem den Aufwand an Zeit und Energie für die Gegenkontrolle mit der Originalhandschrift und das Einpflegen der Korrekturen.
Auf demselben Material mit einer nicht besonders komplizierten, recht sauberen Handschrift erzielten die vorhandenen Lösungen – wohlgemerkt nur diejenigen, die tatsächlich Text erkennen und nicht halluzinieren – Fehlerraten zwischen 3 % und 16 % falsch erkannter Wörter, wobei sowohl grammatische Entstellungen als auch völlig falsche Lesarten eingerechnet sind. Eine solche Quote entspricht falschen Einträgen in jeder dritten bis jeder ersten Zeile des handschriftlichen Textes. Das verzerrt das inhaltliche Bild deutlich und macht das Material in dieser Form kaum tauglich, selbst für eine maschinelle Übersetzung: Fehler in Funktionswörtern lassen sich zwar oft noch von Hand oder per KI ausbügeln, doch das Auftauchen von Wörtern oder Buchstabenkombinationen, die im Originaldokument gar nicht vorkommen, führt zu falschen Deutungen des Sachverhalts.
Unterm Strich hat mein Test-Drive gezeigt: Die Zeit, die in die Bearbeitung und Korrektur der Ergebnisse einer automatischen Transkription einer einfachen Handschrift fließt – inklusive Auffinden und Ausmerzen sämtlicher Fehler –, entspricht ungefähr der Zeit, die ich benötige, um denselben Text von Hand zu transkribieren (und ich tippe dabei recht schnell, im Zehnfingersystem und blind).
Eine eigene Modelllösung trainieren, um noch bessere Resultate zu erzielen? Das ist dann sinnvoll, wenn Sie es mit einem sehr großen Korpus von Dokumenten zu tun haben, die alle von derselben Hand geschrieben wurden. In typischen Archivakten herrscht jedoch eine solche Vielfalt an Handschriften, dass sich darin Blätter finden, mit denen ein individuell trainiertes Modell gut zurechtkommt (also mit ein paar Prozent Fehlern), und andere, bei denen mehr als die Hälfte der Wörter falsch erkannt wird. Zumindest ist das meine Erfahrung: Die Zeit, die in das Training eines Modells auf einen konkreten Dokumentenkorpus (im Umfang von einigen Dutzend oder auch ein bis zwei Hundert Blättern) fließt, übersteigt den Aufwand für eine eigenhändige Transkription – und ganz ohne Abgleich mit anschließenden Korrekturen geht es ohnehin nicht.
Bei einer Transkription Zeile für Zeile ist es entscheidend, den Kontext und den gedanklichen roten Faden des gesamten Dokuments im Blick zu behalten – etwas, was maschinelle Modelle derzeit noch nicht leisten. Nimmt man anschließend eine zusätzliche KI-Bearbeitung der maschinellen Transkription vor, beginnt die KI zu halluzinieren: Sie ersetzt Wörter willkürlich durch ähnliche und erfindet Passagen, die im Ausgangstext nie standen. Solche Überraschungen können Sie nicht zuverlässig entdecken, wenn Sie die Kurrentschrift nicht selbst lesen können.
Zu berücksichtigen sind zudem die Besonderheiten bei Personennamen, geografischen Bezeichnungen, veralteten Begriffen und dialektalen Varianten, die in einer alten Handschrift aus einer bestimmten Region auftreten. Auf professionellem Niveau kann all diese Aufgaben bislang nur ein lebendiger Mensch lösen, der das Lesen altdeutscher Schriften (Kurrent, Sütterlin u. a.) wirklich beherrscht.
Und schließlich kommen Sie an einer professionellen Transkription nicht vorbei, wenn Sie planen, jetzt oder in Zukunft auf Grundlage der transkribierten Dokumente zu publizieren.
Daher lautet meine Antwort und Empfehlung:
– und erst recht, wenn Sie bereits Zeit, Nerven und womöglich Geld in maschinelle und KI-Tools investiert haben und zum Schluss kommen, dass Ihre konkreten Dokumente doch fachkundige Handarbeit brauchen,
Sie können mir Fotokopien oder Scans Ihrer Materialien per E-Mail zusenden (bitte verkleinern Sie die Dateien nicht, sondern schicken Sie die Bilder in der höchstmöglichen Auflösung oder geben Sie einen direkten Download-Link zu einem Cloud-Ordner/Archiv an). Ich prüfe die Lesbarkeit und schätze die Bearbeitungszeit ein (in der Regel übernehme ich sofort Handschriften aus dem späten 18., 19. und 20. Jahrhundert, bei älteren Dokumenten entscheide ich je nach Einzelfall).
Sie können mir auf Englisch, Deutsch oder Russisch schreiben. Grundsätzlich können Sie auch in jeder anderen Sprache anfragen – ich lese Ihre Nachricht dann mit Hilfe maschineller Übersetzung und antworte Ihnen ebenso, damit es für Sie bequem ist.
Den ungefähren Preis können Sie im Voraus selbst einschätzen: Ich berechne 0,10 Euro pro gelesenem Wort (das ist der niedrigste Satz, den ich unter Kollegen kenne). In seltenen Fällen besonders origineller oder schwer lesbarer Handschriften, die ich dennoch übernehme, stimmen wir vorab einen Aufschlag für die betreffenden Seiten ab. Nicht entzifferbare Passagen oder Wörter, bei denen ich mir nicht sicher bin, werden selbstverständlich nicht berechnet.
Als russischer Muttersprachler kann ich für Sie auch russischsprachige Dokumente transkribieren (was für viele, deren Vorfahren einst in Russland lebten, relevant ist). Auch wenn sich die Website auf deutsche Transkriptionen konzentriert, können Sie mich gerne auch für russische Dokumente anfragen.
Mit den besten Wünschen für bereichernde Entdeckungen auf Ihrer Reise in die Vergangenheit,
Artjom W. Wassiljew