CombiTagger

CombiTagger er opinn og frjáls hugbúnaður til að þróa samtvinnaða markara (e. combined taggers), óháð tungumáli og markamengi. Hugbúnaðurinn, sem er skrifaður í Java, var upphaflega þróaður í sjálfstæðu verkefni meistaranemendanna Verena Henrich og Timo Reuter við Háskólann í Reykjavík undir handleiðslu Hrafns Loftssonar á árunum 2008-2009.

Um CombiTagger

CombiTagger er hægt að nota þegar sameina þarf úttak úr fleiri en einum flokkara (e. classifier), t.d. með því að kjósa (e. voting). CombiTagger hefur t.d. verið notaður til að sameina úttak úr tilteknum fjölda (n) markara þannig að hinn samtvinnaði markari skili einu marki fyrir sérhvert orð, t.d. því marki sem fær flest atkvæði á meðal hinna n markaranna.

Samband

Hrafn Loftsson, Ph.D.
Dósent
Háskólinn í Reykjavík - tölvunarfræðideild
Menntavegi 1, 105 Reykjavík
Sími: 5996227
Netfang: < href="mailto:hrafn@ru.is">hrafn@ru.is
Vefsíða: http://www.ru.is/kennarar/hrafn/

Tilvísanir

Henrich, Verena, Timo Reuter og Hrafn Loftsson. 2009. CombiTagger: A System for Developing Combined Taggers. Í Proceedings of the 22nd International FLAIRS Conference, Special Track: "Applied Natural Language Processing". Sanibel Island, Florida. 2009 AAAI.

Hrafn Loftsson, Jökull H. Yngvason, Sigrún Helgadóttir og Eiríkur Rögnvaldsson. 2010. Developing a PoS-tagged corpus using existing tools. Í Proceedings of "Creation and use of basic lexical resources for less-resourced languages", workshop at the 7th International Conference on Language Resources and Evaluation, LREC 2010. Valetta, Möltu.