Vortrag: Helmut Schmid (06.07.2022)

Im Rahmen des Oberseminars Computerlinguistik findet am 6.7.2022 ein Vortrag statt, zu dem wir herzlich einladen möchten.

 

Vortragende:
PD. Dr. Helmut Schmid 
(CIS, Ludwig-Maximilians-Universität München)

 

Zeit:
Mittwoch, 6.7.2022, 16:15–17:45 Uhr, in Präsenz / via Zoom, s.u. über Zugangsdaten/Link.

 

Ort:
Bismarckstr. 12, R.0.320, 91054 Erlangen

 

Thema:
“Wortart-Annotation und Lemmatisierung des Mittelhochdeutschen”

 

Abstract:
Mittelhochdeutsche Texte und andere historische Texte weisen noch keine standardisierte
Schreibweise auf. Die resultierende Variation bei der Rechtschreibung der Wörter erschwert
die Annotierung solcher Texte mit Wortart- und Lemma-Information. Der Vortrag präsentiert
Verfahren auf Basis von Deep Learning, welche auf solchen Texten dennoch gute Ergebnisse
erzielen. Der Tagger verwendet Buchstaben-basierte Wortrepräsentationen, welche regelmäßige
Schreibvariationen lernen können. Der Lemmatisierer basiert auf einer einfachen
Encoder-Decoder-Architektur.

 

(Link folgt über uniinterne Verteiler. Externe Anmeldungen gerne über info@linguistik.uni-erlangen.de.)