EN
Начало » Проекти » Електронни езикови ресурси и програми за тяхната обработка » Обогатяване на лингвистични ресурси с деривационно свързани несвободни фрази

Обогатяване на лингвистични ресурси с деривационно свързани несвободни фрази

Секция по компютърна лингвистика

Срок: 2018 г. – юни 2021 г. (удължен с шест месеца – протокол № 26 от заседание на НС от 04.12.2020 г.)

Вид на проекта: колективен, международен

Партньор: Институт за изследване на изкуствения интелект „Михай Дръгънеску“ към Румънската академия

Финансиране: международен обмен по двустранни спогодби на БАН

Ръководител: гл. ас. д-р Светлозара Лесева (от българска страна)

Участници: гл. ас. д-р Светлозара Лесева, гл. ас. д-р Цветана Димитрова, гл. ас. д-р Мария Тодорова, гл. ас. д-р Валентина Стефанова, д-р Ивелина Стоянова; от румънска страна: ст. изсл. II ст. д-р Верджиника Митителу (ръководител на проекта), д-р Раду Йон, д-р Елена Иримия, д-р д-р Тибериу Борош, д-р Соня Пипа, д-р Мария Митрофан.

Анотация:

Целта на проекта е разпознаването и описанието на несвободни фрази, найчесто глаголни, и техни производни несвободни фрази (разбивам сърцето > разбиване на сърцето; разбивач на сърца), включително на номинални и адективни групи с причастия и др. По-конкретно са включени следните задачи: описание на несвободните фрази, техните производни и отношенията между тях в лингвистични ресурси (Българския и Румънския уърднет); автоматичното откриване на такива единици в корпуси за целите на различни приложения. Описанието на несвободни фрази и производните им позволява създаването на по-точна картина за използването и дистрибуцията им, както и извличането на смислови връзки и автоматичното разпознаване на формално различни, но семантични близки и синтактично съотносими структури.
Проектът се отнася към тематичното направление Електронни езикови ресурси и програми за тяхната обработка.

Форма на представяне на резултатите: обогатено съдържание на Българския уърднет (чрез описание на несвободните фрази и техните деривати несвободни фрази), корпуси с анотирани несвободни фрази; усъвършенствана система за автоматично разпознаване и анотация на несвободни фрази; тематично свързани студии и статии.

начало