Meistarafyrirlestur í tölvunarfræði - Hjalti Daníelsson
Veröld - Hús Vigdísar
Stofa 103
Meistaranemi: Hjalti Daníelsson
Heiti verkefnis: Hugbúnaður til sjálfvirkrar íðorðaleitar innan íslenskra fagtexta
___________________________________________
Deild: Iðnaðarverkfræði, vélaverkfræði og tölvunarfræðideild
Leiðbeinandi: Ebba Þóra Hvannberg, prófessor við Iðnaðarverkfræði, vélaverkfræði og tölvunarfræðideild
Einnig í meistaranefnd: Helgi Þorbergsson, dósent við Rafmagns- og tölvuverkfræðideild
Prófdómari: Hannes Högni Vilhjálmsson, dósent við Háskólann í Reykjavík
Ágrip
Í þessari ritgerð er fjallað um hugbúnað sem framkvæmir sjálfvirka íðorðaleit í íslenskum fagtextum. Farið er yfir fræðin sem liggja að baki íðorðum og íðorðaleit, hvaða áhrif íslenskt mál hefur á svona verk, og hvaða hugbúnaðarval stendur nú þegar til boða fyrir íðorðaleit. Þá er lýst hlutverki hugbúnaðarins í samhengi við verkefni á vegum Stofnunar Árna Magnússonar í íslenskum fræðum (Árnastofnunar) og hvaða skilyrði fylgja því verkefni.
Með tilliti til ofangreindra atriða er tilgreint hvaða aðferðaflokkar og stuðningsforrit urðu fyrir valinu og hvers vegna ákveðið var að ráðast í smíði á leitarhugbúnaði frá grunni. Næst er rakin hönnun hugbúnaðarins sjálfs. Farið er yfir aðal hluta hans - forvinnslu, málvinnslu, tölfræðivinnslu og úttak - og lýst útfærslu hvers fyrir sig með tilliti til þeirra ákveðnu aðferða sem valdar hafa verið og fræðanna sem liggja þeim að baki. Þá er rædd aðferðafræði mælinga, virkni hugbúnaðarins er prófuð og farið er yfir niðurstöður þar að lútandi.
Hugbúnaðurinn reynist virka vel fyrir það hlutverk sem honum var ætlað; aðferðirnar sem hann beitir gefa af sér áreiðanlegar niðurstöður samkvæmt prófunum, og þau stuðningsforrit sem hann reiðir sig á standast þær kröfur sem til þeirra eru gerðar. Að lokum er litið aftur yfir þróunarferlið, auk þess sem ræddir eru möguleikar á viðbótarvirkni fyrir hugbúnaðinn.