Interdistsiplinaarne seto korpus SetKo

Avaleht

Miks me interdistsiplinaarset seto korpust teeme?

Sõltuvalt ideoloogilisest määratlusest ja maailmavaatest võib seto keelt pidada nii keeleks kui ka murdeks. Keeleajalooliselt on tegemist keelevariandiga, mis on koos muu lõunaeesti keelega esimesena lahknenud läänemeresoome algkeelest (vt Viitso 1985). Võrreldes muu lõunaeesti keelega on seto keel geograafiliselt kõige idapoolsem ning ajaloolistel ja kultuurilistel põhjustel ka kõige eripärasem:

  1. Seto keel on olnud pikalt tugevas kontaktis vene keelega, mille mõju avaldub nii sõnavaras (vt Must 2000), häälduses kui ka süntaksis (vt Juhkason jt 2012).
  2. Setod kuuluvad õigeusu kirikusse, mistõttu eristuvad nad kultuuriliselt nii võrukestest kui ka muudest lõunaeestlastest (vt Kalkun 2014).
  3. Setodel on ajalooliselt olnud selgelt oma rahvuslik identiteet, mis ei ole ei eesti ega vene identiteet (vt Jääts 2000).

Setomaa Vene poolel elab praegu umbes 200 seto keele kõnelejat, kelle hulk väheneb pidevalt. Kõnelejate vähenemise on põhjustanud eelkõige külakoolide võrgustiku lagunemine 1970ndatel ja piiri sulgemine 1990ndate alguses.

Kuigi seto keele kohta on viimasel ajal tehtud üksikuurimusi ja ülevaateid (vt nt Lindström, ilmumas), on vaja pöörata rohkem tähelepanu seto keele eripärale, selle tänapäevasele sotsiolingvistilisele olukorrale ja keelekontaktidele.

Kuidas me interdistsiplinaarset seto korpust teeme?

Korpuse koostamine algab keelejuhtide kõne salvestamisest. Korpusesse koondatavad tekstid on enamasti kogutud välitöödel, mis toimusid aastatel 2010, 2011, 2013 ja 2016. Kõneldud tekstid põhinevad poolstruktureeritud intervjuudel, mis tähendavad üldjoontes vaba vestlust keelejuhi elukäigu ja kohaliku elu teemadel. Vestlust suunavad vajadusel konkreetsed sotsiolingvistilised küsimused keelejuhi vanemate päritolu jms kohta. Järgmine etapp on litereerimine ehk tekstide transkribeerimine salvestuselt. Litereerimiseks kasutame lihtsustatud transkriptsiooni, mis on kasutusel TÜ eesti murrete korpuses. Paraku ei ole seto keele jaoks kõnetuvastust, mistõttu tuleb see töö teha käsitsi.

Pärast transkribeerimist tekstid märgendatakse. Selleks kasutame eesti murrete korpuse jaoks loodud märgendusskeemi. Varasemate projektide käigus juba märgendatud tekstid võimaldavad morfoloogilise märgenduse protsessi märgatavalt kiirendada ja hõlbustada: loome varasemate märgenduste põhjal kasutajasõnastikud ning skriptid, mida kasutame tekstide eelmärgendamiseks; sellele järgneb märgenduse kontroll, mida omakorda on võimalik suuresti automatiseerida. Kolmanda märgendustasandina lisame tekstidele temaatilise märgenduse, mis võimaldab folkloristidel ja teistel kultuuriuurijatel tekstidest huvipakkuvat võimalikult lihtsalt üles leida.

Mis on interdistsiplinaarset seto korpuse väljund? 

  1. Seto keel on ohustatud, mistõttu on selle kogumine ja säilitamine pikemas perspektiivis hindamatu väärtusega. 
  2. Setode asualal ja kultuuris on viimase saja aasta jooksul toimunud mitmeid suuri ja radikaalseid muutusi, näiteks haridusoludega seotud muutused, piiriga seotud traumad, kultuuri nivelleerumine. Setode enda kogemusi pole selle kõige sees aga süstemaatiliselt jäädvustatud.
  3. Kuigi välitöödel on kogutud arvestataval määral salvestisi (176 tundi), on neist litereeeritud vaid umbes kuus tundi ehk 50 000 tekstisõna. See tähendab, et praegu litereeritud testide põhjal ei ole võimalik teha järeldusi kogu kõnelejaskonna keele kohta.
  4. Korpus võimaldab tundma õppida näiteks eri piirkondade seto keelt, kultuuri, traditsioone ja õigeusu kiriku pärandit.
  5. Loodav korpus on olemuselt interdistsiplinaarne, mis tähendab, et lisaks lingvistidele on see kasutatav ka näiteks folkloristidel, etnoloogidel, ajaloolastel ja religiooni uurijatel.

Kirjandus 

Juhkason jt = Juhkason, Grethe; Kalkun, Andreas; Lindström, Liina; Plado, Helen (2012). Petserimaa setodest ja nende keelest 2010.-2011. a välitööde põhjal. Õdagumeresoomõ piiriq. Läänemeresoome piirid. Finnic borders (11−29).. Võro Instituut. (Võro Instituudi Toimõndusõq. Publications of Võro Institute).

Jääts, Indrek (2000). Ethnic Identity of the Setus and Estonian-Russian Border Dispute. Nationalities Papers, 28 (4), 651−670.

Kalkun, Andreas (2014). Religioossed paastud ja pidustused seto kultuuri representatsioonides. Keel ja Kirjandus, 1, 1−23.

Lindström, Liina (2020). Seto lause põhijooned. Kalkun, Andreas; Pajusalu, Karl; Västrik, Ergo-Hart (Toim.). Setomaa 3. Keel, rahvaluule ja tänapäeva kultuur (x). Tartu: Eesti Rahva Muuseum.

Must, Mari (2000). Vene laensõnad eesti murretes. Tallinn: Eesti Keele Sihtasutus.

Viitso, Tiit-Rein (1985). Läänemeresoome murdeliigenduse põhijooned. Keel ja Kirjandus 7, 399–404.