Infrastruktur für LOD und Support

As a cross-sectional project, the INF sub-project is intended to implement central technical requirements and methods for the other sub-projects and thus lay the foundations for the interoperability of the data modeled in the TPs and support professional research data management (RDM). The software basis for this is the general Wikidata platform (www.wikidata.org) on the one hand and a separate Wikibase instance on the other, which can accommodate project-specific data that initially does not have general Wikidata identifiers but is nevertheless stored in a Wikidata framework and can be interoperably linked with other parts of the knowledge graph that is created in LODinG. Technically, WikiData, like all projects operated by the Wikimedia Foundation, is based on MediaWiki and uses a Wikibase consisting of a repository to store structured data. The INF project is developing interfaces for this framework in order to be able to synchronize data.

In addition to the TPs involved in LODinG, this should also apply to the research projects based at the TCDH in the fields of digital lexicography, editorial, cultural and literary studies, which generally work with the virtual research environment FuD, and enable the transfer of research data linked to norm data. In a bidirectional connection, data from WikiData can also be accessed directly from FuD via the interfaces to be implemented and links to the research data can be created. In addition, the system supports the annotation of data using freely selectable attributes and categories (e.g. of persons and locations), which in turn can form the basis for further linking with standard data, automatic enrichment (e.g. with geoinformation) and for generating overviews and visualizations (e.g. maps, timelines and other graphs). The annotations can be introduced by corresponding systems such as Inception or FuD.

 

INF (TCDH und UB): Infrastruktur für LOD und Support (Burch, Schirra, Röpke)

Das INF-Teilprojekt soll als Querschnittsprojekt zentrale technische Anforderungen und Methoden für die übrigen Teilprojekte umsetzen und damit die Voraussetzung für die Interoperabilität der in den TPs modellierten Daten legen sowie das professioinelle Forschungsdatenmanagement (FDM) unterstützen.

Die Software-Basis bildet dabei einerseits die allgemeine Wikidata-Plattform (www.wikidata.org) und andererseits eine eigene Wikibase-Instanz, die projektspezifische Daten aufnehmen kann, die zunächst nicht über allgemeine Wikidata-Identifikatoren verfügen und damit trotzdem in einem Wikidata-Framework gespeichert und mit anderenTeilen des Wissensgraphs, der in LODinG entsteht, interoperabel verknüpfbar werden. Technisch setzt WikiData, wie alle von der Wikimedia-Foundation betriebenen Projekte, auf der Basis von MediaWiki auf und verwendet eine Wikibase, bestehend aus einem Repository, um strukturiert Daten zu speichern. Zu diesem Framework werden im INF-Projekt Schnittstellen entwickelt, um Daten synchronisieren zu können.

Dies soll neben den an LODinG beteiligten TPs auch für die am TCDH angesiedelten Forschungsvorhaben aus den Bereichen der digitalen Lexikographie, Editions-, Kultur- und Literaturwissenschaft, die in der Regel mit der virtuellen Forschungsumgebung FuD arbeiten, gelten und eine Übernahme von mit Normdaten verknüpften Forschungsdaten ermöglichen. In bidirektionaler Verbindung kann über die zu implementierenden Schnittstellen auch aus FuD direkt auf Daten aus WikiData zugegriffen und Verknüpfungen mit den Forschungsdaten hergestellt werden.

Zusätzlich unterstützt das System die Annotation der Daten durch frei wählbare Attribute und Kategorien (z. B. von Personen und Orten), was wiederum die Grundlage für eine weiterführende Verknüpfung mit Normdaten, die automatische Anreicherung (z. B. durch Geoinformationen) und zur Generierung von Übersichten und Visualisierungen (z. B. Kartendarstellungen, Timelines und andere Graphen) bilden kann. Die Annotationen können dabei durch entsprechende Systeme wie bspw. Inception oder FuD eingebracht werden.

Neben der technischen Basis ist für das INF-Projekt die inhaltlich systematische Ebene der Wissensorganisation ebenso wichtig. Hier wird die Expertise, wie sie in Bibliotheken im Bereich der Klassifikationsschemata, Normdateien, Thesauri, Ontologien oder auf der Grundlage von Regelwerken zur Inhaltserschließung vorliegt, gezielt in die Umsetzung der Projektziele eingebracht, um Daten strukturier-, interpretier- und abfragbar zu machen.

Team

  • Dr. Thomas Burch
  • Doris Schirra
  • Jörg Röpke