„Natürlich braucht es dennoch ein paar Vorarbeiten“, sagt Anne Klee, Projektmitarbeiterin am TCDH. Beispielsweise müssen die Seiten von gedruckten Wörterbüchern gescannt, mit einer so genannten OCR-Software bearbeitet und in das benötigte Dateiformat XML gebracht werden. „Das Schöne ist aber, dass andere Partner im Projekt auch für die Arbeitsschritte davor einfach bedienbare Tools bereitstellen“, so Klee. Das TCDH der Universität Trier ist der einzige deutsche Partner in dem Projekt, an dem noch 16 weitere Forschungseinrichtungen aus ganz Europa beteiligt sind.
Unterstützung für kleinere Sprachen
Aber warum das Ganze? „Wir wollten ein möglichst niedrigschwelliges Werkzeug schaffen, mit dem jeder in der Lage ist, Wörterbücher zu veröffentlichen ohne große Vorkenntnisse. Vor allem bei kleineren Sprachen, wie beispielsweise Kroatisch oder Serbisch, gibt es oft nicht die Ressourcen spezielle technische Lösungen für die Digitalisierung von Wörterbüchern zu entwickeln. Darüber hinaus wollen wir einen Beitrag leisten, Wissen zu bewahren. Es gibt viele Wörterbücher, die in Bibliotheken verstauben. Wenn sie digitalisiert sind, eröffnet das neue Möglichkeiten“, erklärt Klee.
Selbstverständlich kann in den über Publex veröffentlichten Wörterbüchern ganz bequem über eine Volltextsuche gesucht werden. Außerdem ist das Suchen über benutzerdefinierte Felder möglich. Das Tool eignet sich dafür, sowohl neue Wörterbücher online zu stellen, wie auch vorher digitalisierte Inhalte bereits bestehender Wörterbücher ins Netz hochzuladen. Wer ein Wörterbuch mit Publex veröffentlichen möchte, kann beispielsweise zwischen unterschiedlichen Formatierungen wählen. Das Tool kann als Open Source kostenlos verwendet werden. Es ist aktuell in einer Beta-Version online, die weiter verbessert wird.
Das TCDH-Projektteam, bestehend aus Projektleiter Dr. Thomas Burch sowie den Mitarbeiterinnen Sandra Weyand, Anne Klee, Julia Hennemann und Dr. Claudia Bamberg konnte bei dem Projekt auf das Wissen vorangegangener Projekte zurückgreifen. Die digitale Lexikographie ist einer der Arbeitsschwerpunkte der Forschungseinrichtung der Universität Trier.
Zur Vorstellung von Publex auf YouTube
Kontakt
Anne Klee
Trier Center for Digital Humanities
Mail: kleeuni-trierde
Tel. +49 651 201-3120