Orðskiptingar

Orðskiptingar er pakki með upplýsingum um hvernig á að skipta íslenskum orðum milli lína.

  • Sækja Orðskiptingar 1.0. Með CC BY 4.0 leyfi.
  • Sækja Orðskiptingar 2.0. Með CC BY 4.0 leyfi.

Um Orðskiptingar

Um fyrstu úgáfu

Fyrsta útgáfa var gefin út 1985. Í pakkanum eru þrjár skrár: (1) skipti.listi hefur 203.964 orð í stafrófsröð, eitt orð í línu. Sýnt er með bandstriki hvar í orðinu mega vera skil milli lína; (2) hyphen.is er mynsturskrá sem er búin til upp úr orðalistanum. Mynsturskráin er notuð í orðskiptiforriti fyrir TeX, groff, OpenOffice og LibreOffice; 3) hyph_is-1.0.oxt er skrá sem má sækja hér. Endingin .oxt stendur fyrir "OpenOffice Extension". Ef skrá með endinguna .oxt er opnuð í OpenOffice eða LibreOffice er hún sett inn sem viðbót í viðkomandi forrit.

Efnissöfnun og úrvinnsla

Orðalistinn byggist á uppflettiorðum úr Íslensk-danskri orðabók Sigfúsar Blöndals. Orðin voru tölvuskráð á Íslenskri málstöð á miðjum 9. áratug síðustu aldar. Einnig eru í listanum orð úr stafrænum textum (skáldsögum, blaðagreinum o.þ.h.) sem Baldur Jónsson prófessor hafði safnað. Byrjað var á að skipta um 10.000 orðum með sérstöku forriti og orðskiptingar síðan leiðréttar handvirkt. Niðurstaða þeirrar vinnu var notuð til þess að búa til reglur til þess að skipta næsta skammti sem síðan var leiðréttur handvirkt. Þannig var haldið áfram uns öllum orðum hafði verið skipt. Ýmsir unnu við yfirferð vélrænu skiptingarinnar en Baldur átti sjálfur síðasta orðið um það hvernig hverju orði væri skipt milli lína og fór yfir allan orðalistann í lokin.

Magnús Gíslason sá um alla forritun. Magnús bjó til orðskiptiforrit sem notaði gögnin og algrím sem byggist á doktorsritgerð Frank M. Liang, Word Hy-phen-a-tion by Com-put-er. Forritið var upphaflega gert til þess að nota með TeX-umbrotsforritinu. Magnús gerði einnig forrit fyrir DOS-stýrikerfið sem fór yfir skrár frá WordPerfect-ritvinnsluforritinu. Árið 2009 gerði Magnús íauka fyrir OpenOffice og LibreOffice sem má sækja hér.

Um aðra útgáfu

Útgáfa 2.0, sem var gefin út árið 2020, byggir á útgáfu 1.0 eftir Baldur Jónsson og Magnús Gíslason, ítarlega yfirfarin, leiðrétt og endurskoðuð, með viðbótum úr Risamálheild, Beygingarlýsingu íslensks nútímamáls og veftextum. Forritið Skiptir (http://hdl.handle.net/20.500.12537/87) notar skiptimynstrin úr þessum gögnum.

Aðstandendur

Fyrri útgáfa var unnin á miðjum 9. áratug 20. aldar í Íslenskri málstöð (sem nú er hluti af Stofnun Árna Magnússonar í íslenskum fræðum). Magnús Gíslason og Baldur Jónsson höfðu veg og vanda af verkefninu en ýmsir tóku þátt í að fara yfir orðskiptingar.

Önnur útgáfa var unnin af Rúnari Kristjánssyni á Stofnun Árna Magnússonar í íslenskum fræðum, sem hluti af máltækniáætlun stjórnvalda.

Samband

Steinþór Steingrímsson
netfang: steinthor.steingrimsson@arnastofnun.is