Interdistsiplinaarne seto korpus SetKo

Korpus

Aastatel 20102016 on Liina Lindström ja töörühm erinevate projektide raames teinud neljal korral (2010, 2011, 2013, 2016) välitöid Setomaa Venemaale jäävatel aladel Pihkva oblasti Petseri rajoonis. Välitööde käigus on intervjueeritud enam kui 100 keelejuhti, kellega tehtud intervjuude sisu on hõlmanud tänapäeva elu-olu, seto elukorraldust varasematel perioodidel, kooliharidust, sõdade ja kolhooside perioodi, kiriklikku elu ja sellega seotud kombestikku, seto pühi ja tähtpäevi jne. Esindatud on umbes 40 küla, sealhulgas Petseri linn, kus elavatelt setodelt on kõige enam salvestusi. Petserile järgnevad Sokolova, Kuusinitsa, Risova, Zagorje ja teised. Keelejuhtide keskmine vanus on 69 aastat, kõige nooremad salvestatud kõnelejad on kolmekümnendate alguses, kuid neilt on vaid üksikud lühikesed salvestused. Kaks kõige vanemat salvestatud keelejuhti on 92 aastat vanad. Umbes 80% salvestustest on naiskõnelejatelt, ülejäänu on meestelt ja segapaaridelt.

Välitööde materjalid on hoiul TÜ eesti murrete ja sugulaskeelte arhiivis. Kokku on ülalmainitud nelja uurimisretke jooksul salvestatud 176 tundi materjale audiosalvestistena, osa neist paralleelselt ka videosalvestistena (üle 20 tunni). Varasemate projektide käigus on osa materjale küll litereeritud (u 50 000 tekstisõna) ja morfoloogiliselt märgendatud  (u 11 000 tekstisõna) ning liidetud TÜ eesti murrete korpusega, ent korpuse üldmahtu arvestades on see siiski väga väike osa. Ühtlasi on see olenevalt uuritavast keelenähtusest sageli ebapiisav tõenäosuslike variatsioonimudelite kasutamiseks.

SetKo projekti jooksul on kavas litereerida 50 tunni ulatuses helisalvestisi, need märgendada ja moodustada märgendatud tekstide põhjal korpus, mis võimaldaks teha üldistavaid järeldusi ka kogu kõnelejaskonna keele, mitte ainuüksi individuaalsete keelekasutusmustrite kohta. Tekstide litereerimise ja transkribeerimispõhimõtete ning märgendamise kohta saab täpsemalt lugeda vastavalt all-lehelt.

Accept Cookies