Extraction of semantic statements on the content of Chinese-language specialist literature

China continues to be underestimated in the West as a powerful, innovative and productive research player, not least because a large part of the research output cannot be received due to language barriers. One way to break down these barriers is to make the content of Chinese specialist literature machine-readable and semantic, and thus also language-independent.

With the help of experts in the relevant domains of Chinese-language research and the automatic processing of Chinese language, this sub-project therefore aims to transfer the experience gained in SP3 with the extraction and modeling of semantic statements from specialist literature to a suitable stock of Chinese-language specialist literature and thus make it accessible in a language-independent manner.

TP 4 (Sinologie & Informatik): Extraktion von semantischen Statements zum Inhalt von chinesisch-sprachiger Fachliteratur (Schenkel / Shi-Kupfer)

China als schlagkräftiger, innovativer und produktiver Forschungsakteur wird im Westen weiterhin unterschätzt, nicht zuletzt weil ein großer Teil des Forschungsoutputs aufgrund sprachlicher Barrieren nicht rezipiert werden kann. Ein Weg, um diese Barrieren abzubauen ist es, die Inhalte von chinesischer Fachliteratur maschinenlesbar und semantisch, und damit auch sprachunabhängig, zu repräsentieren. 

Mit Hilfe von Expert:innen für die entsprechende Domänen chinesisch-sprachiger Forschung sowie mit der automatischen Verarbeitung chinesischer Sprache sollen daher in diesem Teilprojekt die in TP3 aufgebauten Erfahrungen mit der Extraktion und Modellierung von semantischen Statements aus Fachliteratur auf einen geeigneten Bestand chinesisch-sprachiger Fachliteratur übertragen und diese dadurch sprachunabhängig zugänglich werden.

Team

  • Prof. Dr. Ralf Schenkel
  • Prof. Dr. Kristin Shi-Kupfer
  • Jens Bruchertseifer