Letnik 5 (2017), številka 1 (1)
April 18, 2017 — 10:37

Sašo Kuntarič
Ljubljana, Slovenija

Simon Krek
Institut “Jožef Stefan”, Filozofska fakulteta Univerze v Ljubljani
Ljubljana, Slovenija

Marko Robnik Šikonja
Fakulteta za računalništvo in informatiko Univerze v Ljubljani
Ljubljana, Slovenija

Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses

Izvleček:
Strojno prevajanje je področje računalniške lingvistike, ki raziskuje uporabo programske opreme za prevajanje besedila iz enega jezika v drugega. Faktorsko statistično strojno prevajanje je različica statističnega, pri katerem besedilu dodamo jezikoslovne oznake na ravni besed in jih spremenimo v vektorje. Tako želimo izboljšati kakovost dobljenih prevodov. V prispevku opišemo uporabo odprtokodnega sistema Moses za faktorsko statistično strojno prevajanje iz angleščine v slovenščino. Iz besedilnega korpusa smo ustvarili več faktorskih in nefaktorskih prevajalnih modelov. Z njimi smo prevedli dve besedili s področja informacijskih tehnologij. Prvo je usmerjeno tržno in ima kompleksnejšo zgradbo, drugo pa je bolj tehnične narave. Prevode, ki smo jih dobili, smo na dva načina primerjali z dvema neodvisnima človeškima prevodoma in s prevodom, ki smo ga ustvarili s storitvijo Google Translate. Za prvi način primerjave smo uporabili metriko BLEU, za drugega pa so prevode pregledali človeški pregledovalci in podali subjektivno oceno, ki je pri prevajanju še vedno zelo pomembna. Čeprav rezultatov ne moremo primerjati neposredno zaradi različnih metrik, se gibanje ocen kakovosti pri obeh besedilih dobro ujema. Edina občutna razlika med računalniško in človeško oceno se pojavi pri prehodu na faktorske modele pri drugem besedilu. Analizirali smo zanesljivost ocenjevalcev in rezultate ocenjevanja. Ugotovili smo, da so naši modeli primernejši za tehnična besedila in da uporaba faktorskih modelov vidneje izboljša prevajanje kompleksnejših besedil.

Ključne besede: statistično strojno prevajanje, faktorsko strojno prevajanje, sistem Moses, BLEU, človeška evalvacija

Referenca: Kuntarič, S., Krek, S., Robnik Šikonja, M. (2017): Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses. Slovenščina 2.0, 2017 (1): 1–26.

URL: http://slovenscina2.0.trojina.si/arhiv/2017/1/Slo2.0_2017_1_01.pdf

DOI: http://dx.doi.org/10.4312/slo2.0.2017.1.1-26

Objavljeno: 1. maj 2017

…na kazalo vsebine…