Extraktion von semantischen Aussagen über den Inhalt chinesischsprachiger Fachliteratur
China wird im Westen nach wie vor als leistungsstarker, innovativer und produktiver Forschungsakteur unterschätzt, nicht zuletzt weil ein großer Teil des Forschungsoutputs aufgrund von Sprachbarrieren nicht rezipiert werden kann. Eine Möglichkeit, diese Barrieren zu überwinden, besteht darin, die Inhalte der chinesischen Fachliteratur maschinenlesbar und semantisch und damit auch sprachunabhängig zu machen.
Ziel dieses Teilprojekts ist es daher, die in SP3 gewonnenen Erfahrungen mit der Extraktion und Modellierung semantischer Aussagen aus Fachliteratur mit Hilfe von Experten aus den relevanten Bereichen der chinesischsprachigen Forschung und der automatischen Verarbeitung chinesischer Sprache auf einen geeigneten Bestand an chinesischsprachiger Fachliteratur zu übertragen und damit sprachunabhängig zugänglich zu machen.
TP 4 (Sinologie & Informatik): Extraktion von semantischen Statements zum Inhalt von chinesisch-sprachiger Fachliteratur
China als schlagkräftiger, innovativer und produktiver Forschungsakteur wird im Westen weiterhin unterschätzt, nicht zuletzt weil ein großer Teil des Forschungsoutputs aufgrund sprachlicher Barrieren nicht rezipiert werden kann. Ein Weg, um diese Barrieren abzubauen ist es, die Inhalte von chinesischer Fachliteratur maschinenlesbar und semantisch, und damit auch sprachunabhängig, zu repräsentieren.
Mit Hilfe von Expert:innen für die entsprechende Domänen chinesisch-sprachiger Forschung sowie mit der automatischen Verarbeitung chinesischer Sprache sollen daher in diesem Teilprojekt die in TP3 aufgebauten Erfahrungen mit der Extraktion und Modellierung von semantischen Statements aus Fachliteratur auf einen geeigneten Bestand chinesisch-sprachiger Fachliteratur übertragen und diese dadurch sprachunabhängig zugänglich werden.
Team
- Prof. Dr. Ralf Schenkel
- Prof. Dr. Kristin Shi-Kupfer
- Jens Bruchertseifer