Цветана Иванова Димитрова
Информация
Главен асистент
Секция по компютърна лингвистика
Телефон: +359 2 9792971
Имейл:cvetana@dcl.bas.bg, tsvetana.dimitrova@gmail.com
Теоретична лингвистика, лингвистична анотация, синтаксис, исторически синтаксис, корпусна
лингвистика, старобългарски език, история на българския език, езикова промяна. Награда за млад учен „Проф. Марин Дринов“ в областта на хуманитарните науки (2011)
Образование и опит
Образование и опит
1996 – 2001: магистър по българска филология (втора специалност – турска филология),
Факултет по славянски филологии, Софийски университет „Св. Климент Охридски“
2002 – 2008: доктор по общо и сравнително езикознание, Норвежки научно-технологичен
университет
2008 – 2010: проучвате, Секция по компютърна лингвистика, Институт за български език, БАН
2010 – до момента: главен асистент, Секция по компютърна лингвистика, Институт за български
език, БАН
Научна дейност
Проекти
Обогатени бази от знания за български и румънски (2015 – 2017), двустранен проект на
Института за български език на Българска академия на науките и Института за изкуствен
интелект на Румънската академия, участник в проекта
Български национален корпус (2010 – ), Институт за български език, Българска академия на
науките, участник в проекта
Българският уърднет (БулНет): Лексикално-семантична мрежа на българския език (2010 – ),
Институт за български език, Българска академия на науките, участник в проекта
Автоматично разпознаване на именувани обекти в български и чешки език (2014 – 2016),
двустранен проект на Института за български език на Българска академия на науките и
Института за чешки език на Чешката академия на науките, ръководител на проекта
Компютърно описание на старобългарското словно богатство (с оглед на създаване на
електронен словообразувателен речник), (с оглед на създаване на електронен
словообразувателен речник) (2012 – 2013), Софийски университет „Св. Климент Охридски“,
проект, финансиран от Фонд „Научни изследвания“ (ДМУ 0313/16.12.2011), ръководител на
проекта
Parsing and multi-word expressions. Towards linguistic precision and computational efficiency in
natural language processing (PARSEME) (2014 – 2017), Information and Communication
Technologies COST Action IC1207, участник в проекта
От лексикално-семантични мрежи към бази от знания: обогатяване на Българския и Румънския
wordnet с морфо-семантична информация (2012 – 2014), двустранен проект на Института за
български език на Българска академия на науките и Института за изкуствен интелект на
Румънската академия, участник в проекта
ЦЕЗАР: Централно и южноевропейски езикови ресурси (CESAR: CEntral and South-east
europeAn Resources) (2011 – 2013), участник в проекта
Супрасълски сборник – старобългарски паметник от Х век: електронен корпус (2010 – 2011),
проект на Института за литература на Българската академия на науките, финансиран от
ЮНЕСКО, участник в проекта
Компютърни и интерактивни средства за исторически езиковедски изследвания (2009-2011),
Софийския университет „Св. Климент Охридски“, участник в проекта
Прагматични ресурси за древните индоевропейски езици (PROIEL), Университет на Осло (2008
– 2012), анотатор на старославянски текстове
Български семантично-анотиран корпус (2008-2010), Институт за български език, Българска
академия на науките, участник в проекта
Членство в научни организации
Международен комитет на славистите, Комисия по компютърна обработка на славянски
ръкописи и старопечатни книги, члена (2010 – до момента)
Участие в организационни и програмни комитети на конференции
Годишна среща на Асоциацията по компютърна лингвистика (The Annual Meeting of the
Association for Computational Linguistics 2013), София, България, 4 – 9 август 2013 г., член на
организационния комитет
Първа международна конференция “Компютърната лингвистика в България” (First International
Conference on Computational Linguistics in Bulgaria (2014), София, България, 4 септември 2014 г.,
член на организационния комитет
Семинар Computing in Humanities, София, България, 8 – 9 април 2015 г., член на
организационния комитет
Глобална Уърднет конференция (Global Wordnet Conference 2016), Букурещ, Румъния, 27 – 30
януари 2016 г., член на програмния комитет
Втора международна конференция “Компютърната лингвистика в България” (Second
International Conference on Computational Linguistics in Bulgaria (2016), София, България 9
септември 2016 г., член на организационния комитет
Паисиеви четения 2016: Юбилейна научна сесия „Съвременни тенденции в езиковедските
изследвания“, посветена на 85 години от рождението на проф. д.ф.н. Йордан Пенчев, Пловдив,
България, 10 – 11 ноември 2016 г., член на организационния комитет
Международна годишна конференция на Института за български език, София, България, 15 – 16
май 2017 г., член на организационния комитет
Публикации
Монографии:
Dimitrova, T. The Old Bulgarian Noun Phrase: Towards an Annotation Specification.
Doktoravhandlinger ved NTNU: 2008:99. Trondheim: Norwegian University of Science and
Technology, 2008, 270 p. ISBN: 978-824- 717-989- 5. [С корекции: Dimitrova, T. The Old Bulgarian
Noun Phrase. Saarbruecken: VDM Verlag, 2011, 316 p. ISBN: 978-363- 934-362- 5.]
Студии/глави в сборници:
Търпоманова, Ек., Цв. Димитрова. Анотиране на паралелни многоезикови корпуси: Българско-
английският паралелел корпус със съотнесени (прости) изречения (BulEnAC). – В: Езикови
ресурси и технологии за български език. София: Академично издателство „Проф. Марин
Дринов“, 2014, с. 105 – 126. ISBN: 978-954- 322-797- 6.
Димитрова, Цв. Лингвистични конвенции при анотация на затворените класове. – В:
Българският семантично анотиран корпус. София: Институт за български език „Проф. Любомир
Андрейчин“, 2010, с. 141 – 156. ISBN: 978-954- 779-124- 4.
Студии и статии в научни списания:
Димитрова, Цв. Наблюдения върху местоименните клитики в историята на българския език. –
Известия на Института за български език, XXIX, Издателство на БАН „Проф. Марин Дринов“,
2016, с. 90 – 106. ISSN: 0323-9934.
Стефанова, В., Цв. Димитрова. Прилагателното име в Българския уърднет. – Български език,
кн. 4, 2016, с. 1 – 15. ISSN: 0005-4283.
Коева, Св., Д. Благоева, С. Колковска, Цв. Димитрова, Ив. Стоянова, Св. Лесева.
Българският национален корпус в контекста на съвременната лингвистика. – Български език, кн.
3, 2015, с. 102 – 119. ISSN: 0005-4283.
Krapova, I., T. Dimitrova. The Genitive-Dative syncretism in the history of Bulgarian. Towards an
analysis. – Studi Slavistici, XII, 2015, pp. 181 – 208. ISSN:1824-761X (print); 1824-7601 (online).
SJR:0.127.
Коева, Св., Ив. Стоянова, Цв. Димитрова, Св. Лесева. Традиции и новаторство в корпусната
лингвистика: Българският национален корпус. – Списание на Българската академия на науките,
кн. 6, 2012, с. 34 – 39. ISSN: 0007-3989.
Dimitrova, T. Computer-Аssisted Description of the Old Bulgarian Lexica Computer-Аssisted
Description of the Old Bulgarian Lexica for an e-Based Derivational Dictionary of Old Bulgarian. –
Littera et Lingua, Autumn 2012, p. 1 – 10. ISSN: 1312-6172.
Koeva, S., I. Stoyanova, S. Leseva, T. Dimitrova, R. Dekova, E. Tarpomanova. The Bulgarian
National Corpus: Theory and Practice in Corpus Design. – Journal of Language Modelling, 1, 2012, pp.
65 – 110. ISSN: 2299-8470, DOI://dx.doi.org/10.15398/jlm.v0i1.33.
Димитрова, Цв. Диахронните корпуси: Подготвителна фаза. – Български език, кн. 3, 2011, с. 119
– 130. ISSN:0005-4283.
Димитрова, Цв. Проблеми на лингвистичната анотация в диахронните корпуси. – Български
език, кн. 1, 2010, с. 23 – 36. ISSN: 0005-4283.
Димитрова, Цв. Двуличното като. – Български език, кн. 3, 2009, с. 149 – 151. ISSN:0005-4283.
Bojadžiev, А., T. Dimitrova. Linguistic Information in the Electronic Corpus of Old Slavic Texts. –
Scripta & e-Scripta, 6, 2008, pp. 105 – 151. ISSN: 1312-238X.
Статии в сборници от конференции:
Dimitrova, T., V. Stefanova. Adjectives in WordNet: Semantic Issues. – In: Proceedings of the 12th
International Conference Linguistics Resources and Tools for Processing the Romanian Language
(ConsILR-2016). Iași: Faculty for Computer Science, Alexandru Ioan Cuza University, 2016, pp. 131 –
141. ISSN:1843-911X.
Koeva, S., I. Stoyanova, M. Todorova, S. Leseva, T. Dimitrova. Metadata Extraction, Representation
and Management within the Bulgarian National Corpus. – In: 4th Workshop on Challenges in the
Management of Large Corpora Workshop Programme. ELDA, 2016, pp. 33 – 39.
Babru Mititelu, V., B. Rizov, E. Tarpomanova, S. Leseva, T. Dimitrova. Noun-Verb Derivation in the
Bulgarian, Romanian and English Wordnets – a Comparative Approach. – In: Proceedings of the 11th
International Conference Linguistics Resources and Tools for Processing the Romanian Language
(ConsILR-2015). Iași: Faculty for Computer Science, Alexandru Ioan Cuza University, 2015, pp. 53 –
64. ISSN: 1843-911X.
Dimitrova, T., A. Bojadziev. Historical Corpora of Bulgarian Language and Second Position Markers.
– In: Proceedings of the First International Conference Computational Linguistics in Bulgaria. Sofia:
Institute for Bulgarian Language, 2014, pp. 55 – 63. ISSN: 2367-5578.
Dimitrova, T., E. Tarpomanova, B. Rizov. Coping with Derivation in the Bulgarian Wordnet.. – In:
Proceedings of the Seventh Global WordNet Conference. Tartu: University of Tartu Press, 2014, pp.
109 – 117. ISBN: 978-994- 932-492- 7.
Koeva, S., B. Rizov, E. Tarpomanova, T. Dimitrova, R. Dekova, I. Stoyanova, S. Leseva, H.
Kukova, A. Genov. Bulgarian-English Sentence- and Clause-Aligned Corpus. – In: Proceedings of the
Second Workshop on Annotation of Corpora for Research in the Humanities (ACRH-2), Lisbon:
Edicoes Colibri, 2012, ISBN:978-989- 689-273- 9.
Eckhoff, H. M., D. J. Birnbaum, A. Miltenova, T. Dimitrova. The Tenth- Century Cyrillic Manuscript
Codex Suprasliensis: the creation of an electronic corpus UNESCO project (2010–2011). – In:
Proceedings of the Workshop on Language Technologies for Digital Humanities and Cultural Heritage
associated with The 8th International Conference on Recent Advances in Natural Language Processing
(RANLP 2011), 2011, pp. 57 – 61. ISBN:978-954- 452-019- 9.
Dimitrova-Vulchanova, M., V. Vulchanov, T. Dimitrova. Issues of Pos-annotation of Old Bulgarian
Texts. – In: Computer Applications in Slavic Studies. Proceedings of Azbuky.Net, International
Conference and Workshop, 24-27 October 2005, Sofia, Bulgaria. Sofia: Boyan Penev Publishing
Center, 2006, pp. 245 – 262. ISBN: 978-954- 871-241- 5.
Koeva, S., S. Leseva, B. Rizov, E. Tarpomanova, T. Dimitrova, H. Kukova, M. Todorova. Design
and development of the Bulgarian Sense-Annotated Corpus. – In: Proceedings of the Third
International Corpus Linguistics Conference (CILC), 7-9 April 2011, Valencia, Spain. Valencia:
Universitat Politecnica de Valencia, 2011, pp. 143 – 150. ISBN: 978-846- 946-225- 6.
Koeva, S., S. Leseva, E. Tarpomanova, B. Rizov, T. Dimitrova, H. Kukova. Bulgarian Sense-
annotated Corpus – Results and Achievements. – In: Proceedings of the 7th International Conference of
Formal Approaches to South Slavic and Balkan Languages (FASSBL-7), 4-6 October 2010,
Dubrovnik, Croatia 2010, pp. 41 – 48. ISBN: 978-953- 553-752- 6.
Koeva, S., S. Leseva, I. Stoyanova, R. Dekova, A. Genov, B. Rizov, T. Dimitrova, E. Tarpomanova,
H. Kukova. Application of Clause Alignment for Statistical Machine Translation. – In: Proceedings of
SSST-6: Sixth Workshop on Syntax, Semantics and Structure in Statistical Translation, ACL 2012 /
SIGMT / SIGLEX Workshop, Jeju, Korea. Association of Computational Linguistics, 2012, pp. 102 –
111. ISBN: 978-193- 728-438- 1.
Koeva, S., S. Leseva, I. Stoyanova, T. Dimitrova, M. Todorova. Automatic Prediction of
Morphosemantic Relations. – In: Proceedings of the Eighth Global Wordnet Conference. Bucharest:
Research Institute for Artificial Intelligence, Romanian Academy, 2016, pp. 168 – 176. ISBN: 978-
973-020- 728-6.
Koeva, S., T. Dimitrova. Rule-based Person Named Entity Recognition for Bulgarian. – In: Slavic
Languages in the Perspective of Formal Grammar (Proceedings of FDSL 10.5, Brno 2014), Series
Linguistik International, vol. 37, Peter Lang, 2015, pp. 121 – 139. ISBN: 978-363- 166-251- 9.
Leseva, S., M. Todorova, T. Dimitrova, B. Rizov, I. Stoyanova, S. Koeva. Automatic Classification
of Wordnet Morphosemantic Relations. – In: Proceedings of the 5th Workshop on Balto-Slavic Natural
Language Processing, The International Conference Recent Advances in Natural Language Processing
(RANLP) 2015, 2015, pp. 59 – 64. ISBN: 978-954- 452-033- 5.
Rizov, B., T. Dimitrova, V. Barbu Mititelu. Hydra for Web: A Multilingual Wordnet Viewer. – In:
Proceedings of the 11th International Conference Linguistics Resources and Tools for Processing the
Romanian Language (ConsILR-2015). Iași: Faculty for Computer Science, Alexandru Ioan Cuza
University, 2015, pp. 19 – 30. ISSN:1843-911X.
Rizov, B., T. Dimitrova. Hydra for Web: A Browser for Easy Access to Wordnets. – In: Proceedings of
the Eighth Global Wordnet Conference. Bucharest: Research Institute for Artificial Intelligence,
Romanian Academy, 2016, pp. 339 – 343. ISBN: 978-973- 020-728- 6.
Tarpomanova, E., S. Leseva, М. Todorova, T. Dimitrova, B. Rizov, V. Barbu Mititelu, E. Irimia.
Noun-Verb Derivation in the Bulgarian and the Romanian WordNet – A Comparative Approach. – In:
Proceedings of the First International Conference Computational Linguistics in Bulgaria. Sofia:
Institute for Bulgarian Language, 2014, pp. 23 – 31. ISSN: 2367-5578.
Димитрова, Цв., А. Бояджиев. Сегментация на диахронните корпуси. – В: Сборник доклади от
заключителната конференция на проект „Компютърни и интерактивни средства за исторически
езиковедски изследвания“. София: ГРАФИС – Ал. Жеков, 2011, с. 96 – 106. ISBN: 978-954- 914-
773-5.