Sabiedrība “Tilde” sadarbībā ar Latvijas Universitāti (LU) ir sekmīgi realizējusi projektu “Lielapjoma statistisko modeļu optimizācijas metodes inovatīvām mašīntulkošanas tehnoloģijām”.

Mūsdienu mašīntulkošanas (MT) risinājumos plaši tiek izmantoti lieli tekstu apjomi, kurus apstrādājot mašīntulkošanas sistēmas “iemācās” tulkot. Gan pētījumi, gan prakse rāda, ka teksta apjomam ir būtiska loma mašīntulkošanas kvalitātes sasniegšanā – jo apjomīgāki un precīzāk izvēlēti teksti tiek izmantoti apmācībai, jo augstāka ir iegūtās MT sistēmas kvalitāte. Diemžēl, pieaugot izmantoto datu apjomam, eksponenciāli pieaug MT sistēmu tehniskā un algoritmiskā sarežģītība. Tas nozīmē, ka, sasniedzot noteiktu datu apjomu, statistisko modeļu aprēķināšanai nepietiek pat ar jaudīgākajiem datoriem, jo ir nepieciešami ļoti lieli skaitļošanas resursi un aprēķini aizņem pārāk ilgu laiku.

Tāpēc “Tilde” sadarbībā ar LU izstrādāja inovatīvas metodes un algoritmus, kas efektīvi apstrādā liela apjoma datus un nodrošina būtisku ātrdarbības un tulkošanas kvalitātes uzlabojumu, salīdzinot ar esošajiem risinājumiem. Izstrādātās metodes un rīki samazina statistiskās mašīntulkošanas izveides un uzturēšanas izmaksas, veicina konkurētspēju tirgū, kurā darbojas globāli uzņēmumi, kas izmanto resursietilpīgas mašīntulkošanas metodes, un paplašina konkrētās ITK tautsaimniecības nozares produktu klāstu un to kvalitāti.

Projektā atrasti inovatīvi risinājumi, kas, nezaudējot tulkojuma kvalitāti, ļauj samazināt MT sistēmas apmācībai nepieciešamo laiku pat par 70% un būtiski (līdz 2/3) samazina apmācībai nepieciešamo datu apjomu. Projektā veikta metožu novērtēšana 20 valodu pāriem trīs nozarēs (informācijas tehnoloģijā, farmācijā un tiesību zinātnē). Projektā izstrādātās tehnoloģijas ļauj izveidot tulkošanas sistēmas, kas sniedz labākus rezultātus kā Google Translate.

Izstrādātie algoritmi un metodes ir izmantotas mašīntulkošanas sistēmas prototipa izveidē. Projekta rezultātus “Tilde” plāno ieviest produkcijā tuvākajā nākotnē.

Pētniecības rezultāti ir apkopoti četrās starptautisko konferenču anonīmi recenzētās publikācijās.

Komentāri 1

Leave a Reply

  • Artx
    September 30, 2015, 10:23

    Ja tas ir kaut kas tiešām labs, tad Tildei būtu jāveic re-brandingu vai jātaisa atsevišķu brendu šai precei, savādāk, vismaz lielai daļai it specu, tas nosaukums drusku asociējas ar tādu kā palamu. Vismaz, ja tiek mērķēts uz Latvijas auditoriju.
    Rakstā gan baigais ūdens, ko varēja pateikt vienā teikumā. Varēja jau izpausties interesantāk.