Letnik 6 (2018), številka 2 (3)
January 27, 2019 — 13:48


Špela Arhar Holdt
Center za jezikovne vire in tehnologije Univerze v Ljubljani
Ljubljana, Slovenija

Jaka Čibej
Inštitut “Jožef Stefan”
Ljubljana, Slovenija

Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike

Izvleček:
Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik). Sledi ročno razvrščanje, v katerem (a) ločimo sistemsko in v rabi utemeljene vzorce od primerov, ki se pojavljajo spričo šuma pri strojnem luščenju in nedoslednosti v leksikonu Sloleks; (b) uredimo skupine glede na vsebovanost in sorodnost podatkov; (c) poiščemo in natančneje opredelimo variantnost, tako pri standardnih kot nestandardnih oblikah; (č) začrtamo korake za nadaljnji razvoj programa in nadgradnjo leksikona. Rezultat je izhodiščni nabor formaliziranih oblikoslovnih vzorcev za (občno- in lastnoimenske) samostalnike, ki prinaša 10 skupin za moški spol, 9 skupin za ženski spol in 8 skupin za srednji spol. Priprava nabora vzorcev je razkrila številne možnosti za izboljšavo leksikona, strojno namenski pogled na pregibanje pa priložnosti za dopolnitev slovničnega opisa slovenščine. V nadaljevanju dela bodo vzorci pripravljeni tudi za preostale besedne vrste in dopolnjeni s korpusnim gradivom. Končna nomenklatura bo vpisana v bazo leksikona Sloleks, v obliki strojno berljivih vzorcev pa bo objavljena tudi na repozitoriju Clarin.si.

Ključne besede: Sloleks, leksikon besednih oblik, oblikoslovni vzorci, samostalnik, slovenščina

Referenca: Arhar Holdt, Š., Čibej, J. (2018): Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike. Slovenščina 2.0, 6 (2): 33–66.

URL: http://slovenscina2.0.trojina.si/arhiv/2018/2/Slo2.0_2018_2_03.pdf

DOI: http://dx.doi.org/10.4312/slo2.0.2018.2.33-66

Objavljeno: 4. februar 2019

…na kazalo vsebine…