Wie jeder Wörterbücher im Internet veröffentlichen kann

An der Universität Trier wurde im Rahmen eines EU-Projekts eine Anwendung entwickelt, mit der Wörterbücher einfach online gestellt werden können.

Der Aufwand damals war enorm: Die Digitalisierung der 300 Millionen gedruckten Zeichen des „Deutschen Wörterbuchs“ von Jacob und Wilhelm Grimm durch ein Projektteam der Universität Trier hat Jahre gedauert. Schon allein die Strukturierung der Einträge für die Online-Version war eine große Aufgabe. Das durch das EU-Forschungsrahmenprogramm „Horizon 2020“ geförderte Projekt ELEXIS hat nun verschiedene Lösungen vorgelegt, die das Digitalisieren von Wörterbüchern einfacher machen. Ein vom Trier Center for Digital Humanities (TCDH) im Rahmen des Projekts an der Universität Trier entwickeltes Tool ermöglicht es nun prinzipiell jedem, Wörterbücher im Internet zu veröffentlichen. Größeres technisches Wissen ist dafür nicht notwendig.

Anne Klee, Dr. Thomas Burch und Dr. Claudia Bamberg
Am Trier Center for Digital Humanities (TCDH) haben Anne Klee, Dr. Thomas Burch und Dr. Claudia Bamberg (v. l.) sowie Sandra Weyand und Julia Hennemann (nicht im Bild) „Publex” entwickelt.

„Natürlich braucht es dennoch ein paar Vorarbeiten“, sagt Anne Klee, Projektmitarbeiterin am TCDH. Beispielsweise müssen die Seiten von gedruckten Wörterbüchern gescannt, mit einer so genannten OCR-Software bearbeitet und in das benötigte Dateiformat XML gebracht werden. „Das Schöne ist aber, dass andere Partner im Projekt auch für die Arbeitsschritte davor einfach bedienbare Tools bereitstellen“, so Klee. Das TCDH der Universität Trier ist der einzige deutsche Partner in dem Projekt, an dem noch 16 weitere Forschungseinrichtungen aus ganz Europa beteiligt sind.

Unterstützung für kleinere Sprachen

Aber warum das Ganze? „Wir wollten ein möglichst niedrigschwelliges Werkzeug schaffen, mit dem jeder in der Lage ist, Wörterbücher zu veröffentlichen ohne große Vorkenntnisse. Vor allem bei kleineren Sprachen, wie beispielsweise Kroatisch oder Serbisch, gibt es oft nicht die Ressourcen spezielle technische Lösungen für die Digitalisierung von Wörterbüchern zu entwickeln. Darüber hinaus wollen wir einen Beitrag leisten, Wissen zu bewahren. Es gibt viele Wörterbücher, die in Bibliotheken verstauben. Wenn sie digitalisiert sind, eröffnet das neue Möglichkeiten“, erklärt Klee.

Selbstverständlich kann in den über Publex veröffentlichten Wörterbüchern ganz bequem über eine Volltextsuche gesucht werden. Außerdem ist das Suchen über benutzerdefinierte Felder möglich. Das Tool eignet sich dafür, sowohl neue Wörterbücher online zu stellen, wie auch vorher digitalisierte Inhalte bereits bestehender Wörterbücher ins Netz hochzuladen. Wer ein Wörterbuch mit Publex veröffentlichen möchte, kann beispielsweise zwischen unterschiedlichen Formatierungen wählen. Das Tool kann als Open Source kostenlos verwendet werden. Es ist aktuell in einer Beta-Version online, die weiter verbessert wird.

Das TCDH-Projektteam, bestehend aus Projektleiter Dr. Thomas Burch sowie den Mitarbeiterinnen Sandra Weyand, Anne Klee, Julia Hennemann und Dr. Claudia Bamberg konnte bei dem Projekt auf das Wissen vorangegangener Projekte zurückgreifen. Die digitale Lexikographie ist einer der Arbeitsschwerpunkte der Forschungseinrichtung der Universität Trier.

Zur Website des Publex-Tools

Zum Publex-Tutorial

Zur Vorstellung von Publex auf YouTube

Kontakt

Anne Klee
Trier Center for Digital Humanities
Mail: kleeuni-trierde
Tel. +49 651 201-3120