MWB Online
MWB Online bietet neben einer elektronischen Ausgabe der bereits im Druck publizierten Wörterbuchlieferungen (aktuell bis Band 2: a – iruele) verschiedene weitere elektronische Materialien: eine umfassende Stichwortliste mit Verknüpfung in den Verbund der Vorgängerwörterbücher im Internet und in das elektronische Belegarchiv des MWB; das Quellenverzeichnis des MWB mit Verknüpfung in die elektronischen Volltexte; und schließlich eine Suchhilfe für Stichwörter, Wortformen und Quellenverzeichnis.
MWB Online wurde von der Trierer Arbeitsstelle entwickelt. Drei gemeinsam mit dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier durchgeführte DFG-Projekte kamen auch MWB Online in besonderem Maße zugute bzw. ermöglichten es überhaupt erst: Der Verbund der retrodigitalisierten mittelhochdeutschen Wörterbücher (MWV) im Internet, der in MWB Online über die Lemmaliste gezielt aufgeschlagen werden kann; das deutsch-amerikanische Kooperationsprojekt Digitales Mittelhochdeutsche Textarchiv / Digital Middle High German Text Archive, für das eine große Zahl von Quellentexten digitalisiert wurde; und schließlich das für die Ausarbeitung des Wörterbuchs eingesetzte internetbasierte Artikelredaktionssystem, das im Sinne der von der DFG geforderten freien Zugänglichkeit von elektronischen Ressourcen von vornherein auch für die Ausgabe des Wörterbuchs und der Wörterbuchmaterialien im Internet einzurichten war.
MWB Online wird in der Trierer Arbeitsstelle gepflegt und im Rahmen der begrenzten Möglichkeiten der Akademiearbeitsstelle, deren personelle Kapazität eng auf die Hauptaufgabe der Ausarbeitung und Publikation des Wörterbuchs zugeschnitten ist, auch weiterentwickelt.
MWB Services
Über das Online-Wörterbuch hinaus stellt das MWB einige Services für die automatisierte Abfrage des Wörterbuchmaterials zur Verfügung (API). Die Services sind frei zugänglich. Sie sind unterschiedlich stark ausgearbeitet und werden kontinuierlich im Rahmen der zur Verfügung stehenden knappen Personalressourcen weiterentwickelt.
Die einzelnen Services sind so gestaltet, dass sie durch die aufrufenden Programme miteinander kombiniert, d.h. in Reihe geschaltet werden können. Wird z.B. mit Hilfe des Lemmatisierungsservice ein Lemmalistenauszug erstellt, können im folgenden Schritt die entsprechenden Metadaten, etwa die Links ins Online-WB, mit Hilfe des Lemmalisten-Service erhoben werden.
Bei allen Services muss bis auf weiteres mit Änderungen der Parameter oder der Ausgabe gerechnet werden. Außerdem kann die ständige Verfügbarkeit der Services nicht garantiert werden. Eine formale API-Beschreibung (OpenAPI) ist in Planung.
Im Rahmen von MWB-APIplus wurde im Jahr 2023 eine standard-konforme Schnittstelle entwickelt, die unter den Drittmittelprojekten näher beschrieben ist.
MWB-Lemmaliste, Verknüpfung mit dem MWV, Metadaten
URL | http://tares.uni-trier.de:8080/exist/rest/db/MWB/xql/retrieve_MWB_lemma_metadata.xql |
Parameter | ID: MWB-Identifier |
Ausgabe | XML; Beschreibung s. URL |
Beispiele | http://tares.uni-trier.de:8080/exist/rest/db/MWB/xql/retrieve_MWB_lemma_metadata.xql?lemma=ader http://tares.uni-trier.de:8080/exist/rest/db/MWB/xql/retrieve_MWB_lemma_metadata.xql?mwv-id=BH00388 http://tares.uni-trier.de:8080/exist/rest/db/MWB/xql/retrieve_MWB_lemma_metadata.xql?ID=68277000 http://tares.uni-trier.de:8080/exist/rest/db/MWB/xql/retrieve_MWB_lemma_metadata.xql?div=d |
Weitere Möglichkeiten, auf die Lemmaliste und das MWB zuzugreifen siehe Experimentelle Services.
Artikelstruktur
URL | https://mwb.adwmainz.net/exist/apps/mwb/api/articles/get-structure.xql?help |
Parameter | lid: MWB-Identifier |
Ausgabe | XML |
Beispiele | https://mwb.adwmainz.net/exist/apps/mwb/api/articles/get-structure.xql?lid=1851000 |
Hinweise | Dieser Service kann mit dem Service "retrieve_MWB_lemma_metadata" (s.o.) kombiniert werden. |
Lemmatisierung
URL | tares.uni-trier.de:8080/exist/rest/db/MWB/xql/lemmatisiere.xql |
Beschreibung | Auf Basis der im MWB vorgenommen manuellen Lemmatierungen des Textcorpus werden Lemmatisierungsvorschläge für eine beliebige Textwortform ausgegeben. Dabei wird lediglich die Zuordnung von Schreibformen zu Lemmata abgefragt; statistische oder kontextbezogene Kriterien werden zur Zeit nicht herangezogen. |
Parameter | wf: Wortform, die lemmatisiert werden soll. Sonderzeichen: UTF-8 searchmethod: Werte: strict|fuzzy, hier wird die Behandlung von Sonderzeichen und Diakritika geregelt. 'Fuzzy' führt viele Sonderzeichen und Diakritika auf ihren Grundbuchstaben zurück und sucht großzügiger als 'strict'. Default ist 'fuzzy'. resultset: Werte: strict|fuzzy, hier geht es um die Treffergenauigkeit in Bezug auf Kodierungskonventionen des Mittelhochdeutschen Wörterbuchs, wie z.B. Homographentrenner und andere Zusatztags. 'Strict' wird in aller Regel höherwertige Ergebnisse liefern, 'fuzzy' mehr Ergebnisse. Default ist 'strict'. ntype: Werte: multiple|unique. Parameter bestimmt, ob Treffer, die ein und demselben Lemma angehören, zusammengefasst werden sollen. 'multiple' liefert für jeden Einzeltreffer einen Ergebniseintrag; 'unique' fasst Treffer zusammen, die zu einem Lemma gehören. |
Ausgabe | XML; Beschreibung s. URL |
Beispiele | http://tares.uni-trier.de:8080/exist/rest/db/MWB/xql/lemmatisiere.xql?wf=hân http://tares.uni-trier.de:8080/exist/rest/db/MWB/xql/lemmatisiere.xql?wf=hân&searchmethod=strict |
Schreibformen
URL | http://tares.uni-trier.de/Mhdwb/Services/retrieve-types |
Beschreibung | Ermittelt alle Schreibformen, die einem Lemma im Archiv des MWB durch manuelle Lemmatisierung zugeordnet wurden. Normalerweise ist es sinnvoll, diesen Service mit dem Lemmalisten-Service zu koppeln. |
Parameter | Identifier des MWB (als Pfad-Parameter) |
Ausgabe | XML |
Beispiel | http://tares.uni-trier.de/Mhdwb/Services/retrieve-types/116904000 |
Experimentelle Services
Die folgende API wurde während der Mitarbeit der Trierer MWB Arbeitsstelle am “eHumanities Zentrum für historische Lexikographie” als Prototyp erarbeitet. Nähere Angaben zur Spezifikation finden sich im Abschlussbericht des Projekts: <https://doi.org/10.2314/KXP:1728621410> und auf <https://zhistlex.de/ziele/ap2/webservices-woerterbuecher/interaktiv/>. Das Rückgabeformat der ZHistLex-API ist JSON.
Beispiele für die Suche im Wörterbuch
http://tares.uni-trier.de/ZHistLex/API/dictionaries/entries;fulltext=baden
http://tares.uni-trier.de/ZHistLex/API/dictionaries/entries;regex=.*bad[aeiou]n
http://tares.uni-trier.de/ZHistLex/API/dictionaries/entries;lemma=baden
Beispiele für die Suche im Quellenverzeichnis
http://tares.uni-trier.de/ZHistLex/API/records;fulltext=Eckhart
http://tares.uni-trier.de/ZHistLex/API/records;ppn=524027064