Projekts: Teksta analīzes metodes un rīki līdzīguma noteikšanai un mērīšanai lielos nacionālos tekstu korpusos

Izdrukāt

Valsts izglītības attīstības aģentūras Latvijas–Ukrainas zinātniskās sadarbības 2020. gada pētniecības projektu konkursā 2020. gada 17. decembrī apstiprināts Latvijas Nacionālās bibliotēkas (Dr. Valtera Ščerbinska vadībā) un Ukrainas zinātniski tehniskā ekspertīžu un informācijas institūta (Dr. Oļenas Chmiras vadībā) kopīgi iesniegtais projekts "Teksta analīzes metodes un rīki līdzīguma noteikšanai un mērīšanai lielos nacionālos tekstu korpusos: Latvijas Nacionālās digitālās bibliotēkas un Ukrainas Nacionālā akadēmisko tekstu repozitorija gadījumi" (Text Analysis Methods and Tools for Similarity Metrics in Large National Text Corpora: the Case of the Latvian National Digital Library and the National Repository of Academic Texts of Ukraine).

Projekta mērķi:

  • Izpētīt un izvēlēties piemērotāko datorizētā teksta analīzes metodi teksta sakritību un līdzīguma konstatēšanai un mērīšanai lielos tekstu korpusos;
  • Izstrādāt testa vidi un tekstu salīdzināšanas mikroservisu darbam atlasītos tekstu korpusos;
  • Veikt gadījuma analīžu pētījumus pielietojot izstrādāto instrumentu;
  • Iesaistīt vietējo humanitāro un sociālo zinātņu pētnieku kopienu izstrādātā mikroservisa testēšanā, pilnveidē un pielietojumā pētījumos;
  • Zināšanu un pieredzes apmaiņa ar Ukrainas partneriem, sadarbības pieredze;
  • Gūtās pieredzes un pielietojuma rezultātu izplatīšana – publikācijas, konferences.

Teksta sakritību un līdzību mērīšanas mikroservisa iekļaušana LNB digitālās pētniecības atbalsta pakalpojuma instrumentārijā ļaus to pielietot meklējot teksta līdzības un sakritības:

  • valodniecībā valodas izmaiņu meklēšanā;
  • kontentanlīzē ideju, stereotipu, viedokļu un "šablonu" izplatības un noturības identificēšanā;
  • komunikācijas zinātnē ziņu tiražēšanas un žurnālistikas oriģinalitātes pētīšanā;
  • iespējamā plaģiāta pazīmju uzrādīšanā;
  • literatūrzinātnē cenzūras "pēdu" izgaismošanā;
  • u. c.

Projekta norises laiks: 2021–2022

Projekta budžets Latvijas pusei: 38 610,00 EUR

Projekta finansētājs: Valsts izglītības attīstības aģentūra