Legal LOD - Konzeptbasierte Erschließung mehrsprachiger europäischer Rechtstexte

Gegenstand des juristischen Teilprojekts ist der Aufbau eines mehrsprachigen Korpus von europäischen Rechtstexten mit Bezug zur Digitalisierung, wie z.B. der Digital Services Act 19 October 2022 (Verordnung 2022/2065). Derartige Texte liegen in den 24 Amtssprachen der EU vor, wobei alle Sprachfassungen gleichermaßen verbindlich sind und somit prinzipiell als inhaltlich gleichwertig gelten, wodurch der Grundsatz der Gleichwertigkeit des EU-Rechts in allen Mitgliedstaaten verwirklicht werden soll. Aufgrund der komplexen Redaktions-, Abstimmungs- und Übersetzungsprozesse gibt es jedoch immer wieder Unterschiede im Detail, die mit der einfachen synoptischen Darstellung auf der EUR-Lex-Plattform nicht gefunden und geklärt werden können.

Das Teilprojekt zielt darauf ab, dieses Problem zu lösen, indem: (a) die Rechtstexte Satz für Satz automatisch aligniert werden; (b) zentrale Rechtsbegriffe und andere Konzepte identifiziert und als LOD-fähige Ontologie zur Verfügung gestellt werden; (c) diese Konzepte über die Übersetzungen hinweg (zunächst manuell, dann automatisch) annotiert werden; und schließlich (d) eine konzeptgeleitete Suche nach Begriffsverwendungen und Definitionen relevanter Begriffe über verschiedene Sprachversionen hinweg ermöglicht wird, so dass im Detail abweichende Passagen identifiziert und ihre Bedeutung für die europaweite nationale Rechtsprechung abgeschätzt werden kann. Die freie Verfügbarkeit der Texte und ihre Verfügbarkeit im halbstrukturierten HTML-Format sind für dieses Projekt förderlich.

TP6 (Digitale Rechtswissenschaft): Legal LOD – Konzept-basierte Erschließung von mehrsprachigen europäischen Rechtstexten

Gegenstand des rechtswissenschaftlichen Teilprojekts ist die Erschließung eines mehrsprachigen Korpus von europäischen Rechtstexten mit Bezug zur Digitalisierung, wie beispielsweise dem Digital Services Act 19. Oktober 2022 (Verordnung 2022/2065). Diese Textsorte liegt in den 24 offiziellen Sprachen der EU vor, wobei alle Sprachfassungen gleichermaßen verbindlich sind und daher prinzipiell als inhaltsgleich gelten, wodurch das Prinzip der Gleichheit des EU-Rechts in allen Mitgliedstaaten realisiert werden soll. Allerdings kommt es durch die komplexen Bearbeitungs-, Abstimmungs- und Übersetzungsprozesse immer wieder zu Abweichungen im Detail, die durch die einfache synoptische Darstellung auf der EUR-Lex-Plattform nicht aufgefunden und geklärt werden können.

Dieses Problem möchte das Teilprojekt lösen, indem es: (a) die Rechtstexte automatisiert satzweise aligniert; (b) zentrale rechtswissenschaftliche Begriffe sowie weitere Konzepte identifiziert und als LOD-fähige Ontologie verfügbar macht; (c) diese Konzepte über die Übersetzungen hinweg annotiert (zunächst händisch, dann automatisiert); um schließlich (d) eine Konzept-geleitete Suche nach Begriffsverwendungen und Definitionen von relevanten Begriffen über verschiedene Sprachfassungen hinweg erlaubt, sodass im Detail abweichende Passagen identifiziert und in ihrer Bedeutung für die europaweite nationale Rechtsprechung bewertet werden können. Die freie Verfügbarkeit der Texte sowie ihr Vorliegen in semi-strukturiertem HTML-Format kommen diesem Vorhaben entgegen.

Verordnung (EU) 2022/2065 des Europäischen Parlaments und des Rates vom 19. Oktober 2022 über einen Binnenmarkt für digitale Dienste und zur Änderung der Richtlinie 2000/31/EG (Gesetz über digitale Dienste), data.europa.eu/eli/reg/2022/2065/oj.

Team

  • Dr. Thomas Burch
  • Prof. Dr. Benjamin Raue
  • Veronika Wassermayr