IceWordNet

IceWordNet er íslensk útgáfa af Princeton Core WordNet. Það samanstendur af tæplega fimmþúsund íslenskum þýðingum á orðunum úr kjarnalista Princeton ásamt íslenskum samheitum orðanna.

  • Sækja IceWordNet. Með CC BY 3.0 leyfi.

Um IceWordNet

IceWordNet IceWordNet er byggt á kjarnalista  Princeton WordNet (Princeton Core WordNet). Princeton WordNet er stór, gagnagrunnur um ensk orð. Nafnorð, sagnir, lýsingarorð og atviksorð eru flokkuð í nokkurs konar samheitamengi sem hvert um sig tjáir ákveðna hugsun. Samheitamengin eru síðan tengd hvert öðru eftir hugtakslegum, merkingarlegum og orðbundnum venslum. WordNet er ekki ósvipað samheitaorðabók en þó er munur þarna á. Fullgert tengir WordNet ekki bara saman orðmyndir heldur einræðir svipuð orð og sýnir að auki hvers konar vensl eru á milli orðanna.

Í kjarnalista WordNet eru ríflega 5000 algengustu orðin úr Princeton-listanum. Íslenska orðanetið, IceWordNet, er íslensk þýðing á orðunum í kjarnalistanum auk íslenskra samheita orðanna. Enn sem komið er eru eingöngu gefin samheiti en önnur vensl ekki sýnd.

Kjarnalisti Princeton WordNet var sóttur á netið. Síðan voru ensku orðin þýdd yfir á íslensku. Því næst voru samheiti íslensku orðanna skráð eftir bestu getu með hjálp Íslenskrar samheitaorðabókar (Svavar Sigmundsson 1985) og snöru.is. Verkið var unnið af Kristínu M. Jóhannsdóttur.

Æskilegt væri að IceWordNet yrði síðar stækkað til muna og að auk samheita yrðu þarna flest þau vensl sem notuð eru í Princeton WordNet.