Kai Kugler, M.A.
Wissenschaftlicher Mitarbeiter
Publikationen
- Kugler, K., Münker, S., Höhmann, J. & Rettinger, A. (2024) 'InvBERT: Reconstructing Text from Contextualized Word Embeddings by inverting the BERT pipeline', Journal of Computational Literary Studies. 2(1) :1–18. doi: 10.48694/jcls.3572
- Kugler, K. and Rettinger, A. (n.d.). A survey on latent linguistic patterns in bidirectional transformer-based language models. In: S. Arndt‐Lappe, M. Belosevic, P. Maurer, C. Moulin, A. Rettinger and S. Stumpf, eds., Pattern Theory in Language and Communication. Berlin: De Gruyter.
Forschungsprojekte
- 2022-2024 Mitarbeit im Projekt "Social Sentiment in Times of Crisis (SOSEC)" des Forschungszentrum Informatik (FZI), Forschungsteam Social-Media-Monitoring
- 2019-2023 Verbundprojekt "Patterns. Linguistic creativity and variation in synchrony and diachrony" am Trier Center for Language and Communication (TCLC)
Drittmittelprojekte
- 2023-2024 Projekt "Lernmodule Datenverarbeitung auf der Kommandozeile", gefördert im Rahmen des Teaching Incentive Fund der Universität Trier. Fördersumme 5000€
Universitäre Selbstverwaltung
- 2022 Wahlausschußvorsitzender Nachwahl für den Rat des Fachbereichs II
- 2018-2024 Mitglied im Rat des Fachbereichs II
- 2018-2024 Mitglied in der Bibliothekskommission des Fachbereichs II
- 2018 Mitglied in der Berufungskommission W2-Professur für Computerlinguistik
Zweitbegutachtung Bachelor- und Masterarbeiten
Bachelorarbeiten
- Thielen, Felix (2024): Attention in Transformer-basierten Sprachmodellen. Explainable Artificial Intelligence am Beispiel der Negation.
- Vietze, Marlene (2023): Bias in Sprachmodellen.
- Schröder, Jan (2023): Implementation and Visualization of Clustering Algorithms in an NLP-Pipeline.
- Rostin, Tim (2022): Moderne Dialogsysteme. Implementierung eines Dialogsystems auf Basis feinjustierter neuronaler Netze.
- Karst, Julia (2022): Das Chinabild in Zeiten Coronas. Eine Nachrichtenanalyse mittels Latent Dirichlet Allocation.
- Ondraszek, Sarah (2021): "Vivez si m'en croyez, n'attendez à demain. Cueillez des aujourd'hui les roses de la vie.". Building and Preprocessing a Corpus for Topic Modeling in Context of the Pléiade and French Renaissance Poetry.
- Yalama, Ali-Kemal (2021): Erstellen von RNN-Sprachmodellen für Privatanwender.
- Weber, Viktoria (2021): Automatische Erkennung von Anglizismen in Deutschsprachigen Texten.
- Elsässer, Nathalie (2021): IPA-To-Speech. Ein konkatenatives Synthesesystem der deutschen Aussprache.
Masterarbeiten
- Garthe, Johanna (2023): Automatic Cross-Target Stance Detection with Fine-Tuned BERT: An Examination of German Twitter Data on the Russian-Ukrainian Conflict 2022.
- Wimmelmann-Gálvez, Maya (2023): Linguistic Representation in Multilingual BERT: How Do Genealogical and Typological Features Affect the Quality of Multilingual BERT Embeddings?
- Dirlam, Nora (2023): Ein Deep Learning basierter Ansatz für die automatische ICD-Codierung von Versorgungsdiagnosen.
- Meyer, Vivien (2023): Automatic Speech Recognition Model Adaption. Fine-Tuning 'Whisper' for Domain Specific Language.
- Probst, Amelie (2022): Automatisierte Twitter-Hatespeech Analyse von Reaktionen auf Corona-Maßnahmen.
- Ittner, Hannah (2022): Corona und Sprache. Computerlinguistische Untersuchung des Einflusses einer globalen Pandemie auf die Online-Berichterstattung in Deutschland und Italien.
- Chen, Yi-Hsiu (2022): Fine-tuning BERT on COVID-19 Real World Worry Dataset.
- Bernardy, Laura (2022): A Luxembourgish GPT-2 approach based on transfer learning.
- Nkoundjo, David Otrive (2021): Universal Dependencies for Fe'efe'e.
- Hu, Yanqing (2020): Zwei-Phasen Summarization für wissenschaftliche Artikel: Eine Kombination von extraktiven und abstraktiven Ansätzen.
- Palm, Rebecca (2020): NLP-Verfahren zur Erkennung persuasiver Wirkungsintentionen.
- Dudar, Iuliia (2020): Sentiment Analyse in dem medizinischen Kontext: Am Beispiel der Sentiment Klassifikation von Medikamentenbewertungen mit BERT.
- Dietrich, Clarissa (2020): Gendergerechte Sprache - Überprüfung mithilfe des Encoder-Decoder-Modells.
- Fileva, Evgeniia (2020): Dialogmanagementstrategien in Dialogsystemen.
- Kahhorova, Gulchehra (2020): Sprachwandel im Tadschikischen. Eine quantitativ-linguistische Untersuchung.
- Werner, Simon (2019): Named Entity Recognition mit neuronalen Netzen.
- Dürr, Milena (2019): Automatische Spracherkennung für das computergestützte Aussprachetrainiung im Zweit- und Fremdspracherwerb.
Lehre
Masterstudiengang Natural Language Processing (2022-2024)
- Research Case Studies (Projektseminar)
- Advances Topics in Computational Text and Media Sciences (Seminar)
- Machine Learning for Natural Language Understanding (Übung)
Bachelorstudiengang Sprache, Technologie, Medien (2022-2024)
- Machine Learning für Text, Medien und Wissen (Übung)
- Natural Language Processing: Grundlagen (Vorlesung und Seminar)
Bachelorstudiengang Computerlinguistik (2017-2022)
- Projektseminar Computerlinguistik
- Theoretische Aspekte der Computerlinguistik (Seminar)
- Grundlagen der Computerlinguistik (Seminar)
- Praxis der Sprach- und Textanalyse (Seminar)
- Computerlinguistische Programmierung (Übung)
- Statistik für Linguisten (Vorlesung und Übung)
- Methoden und Anwendungen der Statistik (Vorlesung und Übung)
- Algorithmen und Datenstrukturen (Vorlesung und Übung)
Masterstudiengang Computerlinguistik (2017-2021)
- Mathematische Modellierung (Seminar)
- Einführung in die systemtheoretische Linguistik (Vorlesung)
- Computerlinguistische Programmiertechnik (Übung)
- Methoden der Korpusanalyse (Seminar)