Есенен лингвистичен семинар 2022
На 4 ноември 2022 година от 11:00 часа Институтът за български език организира Есенен лингвистичен семинар.
Болете Сандфорд Педерсен от Университета в Копенхаген, Дания, ще изнесе лекция на тема Ролята на лексикално-концептуалните ресурси в ерата на езиковите модели (The Role of Lexical Conceptual Resources in the Era of Language Models, резюме).
Семинарът ще се проведе онлайн (в Зум).
ID на срещата: 857 4322 3963
Парола: 821408
Болете Сандфорд Педерсен е професор по компютърна лингвистика, заместник-ръководител на Секцията за скандинавски проучвания и лингвистика и ръководител на Центъра за езикови технологии. Основните й научни интереси включват компютърна лексикография, лексикална семантика и лингвистични онтологии.
Болете Сандфорд Педерсен е била координатор на скандинавската NORFA мрежа SPINN за хармонизиране на езиковите ресурси в скандинавските страни, координатор на участието на датския екип в Senseval2 за семантична анотация, ръководител на проекта на DanNet, ръководител на екип за разработване на лексикални ресурси в DK-CLARIN (2008-2011), датски координатор на проекта на ЕС CLARA — Common Language Resources and their Applications — a Marie Curie Initial Training Network (2011-2014) и на проекта на ЕС META-NORD (2011-2013), ръководител на проекта Semantic Processing Across Domains, финансиран от Датския изследователски съвет (2013-2016). Тя е била член на различни научни програмни комитети в ACL, COLING, Global WordNet Conference, Euralex Congress, LREC, OntoLex и др. |
Ролята на лексикално-концептуалните ресурси в ерата на езиковите модели
През последните десетилетия се разработват лексикално-концептуални ресурси (като уърднети, фреймнети, терминологии и онтологии) за много езици, за да се посрещнат нуждите на системите за автоматична обработка на естествените езици за формално представяне на семантиката на думите и фразите, както и за това как те се отнасят към света. През последните години невронните езикови модели преобърнаха автоматичната обработка на езика – тъй като наложиха подход, базиран единствено на текстов анализ върху големи корпуси. Време е да се запитаме: Каква е ролята на лексикално-концептуалните ресурси в ерата на невронните езикови модели? В тази лекция се застъпва тезата, че тези ресурси все още играят решаваща роля, тъй като системите за автоматичен анализ на езика, основани само на анализ на дистрибуцията на езиковите явления, до известна степен винаги ще бъдат недостатъчни и ненадеждни. Чрез примери от своята работа, която през годините се провеждаше в тясно сътрудничество с водещи лексикографи в Дания, ще илюстрирам как такива концептуални ресурси могат да бъдат разработени на основата на вече съществуващи висококачествени и непрекъснато актуализирани лексикографски ресурси, а също така и как те могат да бъдат допълнително пригодени за определени изследователски нужди чрез изследване на дистрибутивните модели на думите и тяхната съчетаемост.