Menu Close

Naujienos

Skaitmeninė mįslių kartoteka: lietuvių tautosakos išteklių turtinimas

Skaitmeninė mįslių kartoteka yra sudedamoji Lietuvių tautosakos elektroninių išteklių dalis ir kartu su liaudiškųjų tikėjimų bei Pokario partizanų dainų kartotekomis sudaro bendrą Tautosakos skaitmeninių kartotekų posistemę.

Mįslių skaitmeninė kartoteka kuriama kortelinės lietuvių mįslių sisteminės kartotekos pagrindu. Ji yra Lietuvių literatūros ir tautosakos institute (toliau - LLTI) ir apima apie 100 000 mįslių, ir dar turima netvarkytų 40 000 išrašytų į korteles mįslių.

Kartotekos kūrimą maždaug prieš 30 metų sumanė ir pradėjo akademikas prof. habil. dr. Leonardas Sauka. Jo vadovaujami studentai iš LLTI Lietuvių tautosakos archyvo rankraščių išrašė mįsles į korteles, kurios pagal įminimus (atsakymus) buvo suskirstytos abėcėlės tvarka. Šis pirminis skirstymas buvo mechaniškas: tarmiškus, sinonimiškus atsakymus arba vienodus tekstus, bet kitokius atsakymus turinčios mįslės atsidurdavo skirtingose kartotekos vietose, niekaip nebuvo susietos. Neretai į tą patį užminimą pateikiami keli skirtingi įminimai, ir visi jie laikomi teisingais. Pavyzdžiui, mįslės užminimas „Įkiši - marma, ištrauki - varva“ turi tokius įminimus: svirtis, kibiras, rūbas, samtis, sruoga, skalbti, sviestą mušti, šulinys, vanduo.

Kurdama skaitmeninę kartoteką, LLTI siekia išsaugoti ir padaryti prieinamą didžiąją dalį sukaupto lietuvių mįslių masyvo, atspindinčio daugelį dešimtmečių kauptą turtingumą ir įvairovę.

Lietuvių liaudies mįslių iliustracija

Kiekvienas mįslės objektas priklauso kokiai nors tipo versijai. Prie kiekvienos versijos yra komanda rodyti objektus, kurią spustelėjus išskleidžiamas tai versijai priskirtų objektų sąrašas. Fiksacija yra apibrėžiama kaip konkretus folkloro vieneto, galinčio turėti ne vieną versiją, užrašymas, pvz., teksto originalas, redaguota / adaptuota versija ir kt.

Mįslių žanrą sudaro tokie skyriai: objektų mįslės, mįslės apie konkretų atsitikimą, mįslės apie raides, garsus ir žodžius, objektų minklės, tikrosios minklės, anekdotinės minklės, galvosūkiai. Didžiąją lietuvių mįslių masyvo, o taip pat ir Skaitmeninės kartotekos dalį sudaro objektų mįslės, žymiai mažiau turime objektų ir tikrųjų minklių, ir visai nedaug kitų šio žanro skyrių tautosakos vienetų.

Skaitmeninė Mįslių kartoteka atspindi kortelinės kartotekos tipologinę sistemą. Tipas yra mįslių grupė, sudaryta iš vienos ar keleto panašių versijų. Versija yra mįslių grupė, kurią sudaro analogiškos ar labai panašios sintaksinės struktūros ir iš tos pačios reikšmės leksikos sudaryti užminimų tekstai. Kiekviena versija priklauso kokiam nors tipui. A1 versija yra daugiausia vienodų ar panašių mįslių turinti versija ir dažniausiai sutampa su tipo pavadinimu. Tas pats tipas ir versija jungia panašius užminimus turinčias mįsles, kurios gali turėti labai skirtingus atsakymus. Mįslių tipai gali būti panašūs meniniu vaizdu ar susiję per kontaminuotas versijas. Kai panašumas labai artimas, stengiamasi tokias mįsles jungti į vieną tipą, tačiau kartais tai neįmanoma dėl to, kad vaizdas gali būti labai išplėtotas, panašus skirtingais fragmentais, o sujungus visas panašių vaizdų versijas į vieną tipą, šis taptų itin didelis, išplaukusiomis ribomis.

Nuo 1997 m. pabaigos (su trejų metų pertrauka) kartoteką tvarko Aelita Kensminienė. Gana ilgą laiką nuosekliau sisteminamos buvo tik vadinamosios objektų, arba tikrosios, mįslės. 2006 m. buvo susistemintos objektų ir tikrosios minklės. Kartoteka dar nėra visiškai užbaigta, jos kūrimas tęsiamas.

Kitas naujosios skaitmeninės kartotekos pagrindas - anksčiau sukurta mįslių duomenų bazė: tai 2006-2011 metais LLTI vykdytas Valstybinės lietuvių kalbos komisijos (VLKK) remtas projektas „Elektroninės LLTI sukauptų lietuvių mįslių duomenų bazės kūrimas pagal Valstybinės kalbos norminimo, vartojimo, ugdymo ir sklaidos 2006-2015 m. programą“. Projektui vadovavo, kūrė bazės struktūros principus, atrinkinėjo ir klasifikavo mįsles, įvesdavo tipų ir versijų pavadinimus į duomenų bazę Aelita Kensminienė, duomenų bazę sukūrė ir jos veikimą užtikrino IT specialistas Arūnas Ciesiūnas.

Senoji duomenų bazė buvo sukurta atvirojo kodo MySQL pagrindu, duomenų manipuliavimui sąsaja sukurta taip pat atvirojo kodo skriptų kalba - PHP. Visi tekstai priklausė tam tikrai hierarchinei žanro klasifikacijos ir tipologinei sistemai - tarsi „tipų tinkleliui". Šią sistemą sudarė žanro skyriai, tipai su versijomis ir atsakymai - visa tai buvo pagrindiniai paieškos parametrai.

Šiame projekte vartotojo prieigos sukūrimo darbai nebuvo numatyti. Projekto finansavimas buvo labai kuklus, o darbo tempas milžiniškas, tad tik labai mažas iš kortelių (kurios yra išrašai iš rinkinių) įvedamos informacijos kiekis buvo tikrinamas pagal originalus, atsisakyta papildomos mokslinės analizės. Vis dėlto bazės pagrindas sukurtas, į ją įvesta 76000 objektų mįslių (likusius 4000 sudarė kiti žanro skyriai).

Džiugu, kad šie darbai buvo pratęsti Lietuvos mokslo tarybos (LMT) 2012-2014 m. vykdomame projekte „IRT sprendimų bei turinio, padedančių išsaugoti lietuvių kalbą viešojoje erdvėje, kūrimas bei galimybių jais naudotis sudarymas". Projekto metu buvo perkelti mįslių duomenys iš senosios duomenų bazės, kartu išplėsta jos struktūra (sukurti reliaciniai ryšiai tarp atskirų duomenų bazių dalių, verifikuoti esami klasifikatoriai, įvesti papildomi mokslinės analizės įrankiai), mįslių įrašai papildyti informacija iš Lietuvių tautosakos rankraštyno bei tipologiniais žymenimis, patikslinta įrašų tekstų transkripcija ir metaduomenų informacijos kokybė, bazės prototipas susietas su universalesne informacine sistema, sukurta vartotojo prieiga.

Lietuvių mįslių tipologinė sistema
Žanro skyrius Tipas Versija Objektas
Objektų mįslės Svirtis A1 Įkiši - marma, ištrauki - varva
Objektų mįslės Kibiras A1 Įkiši - marma, ištrauki - varva
Objektų mįslės Rūbas A1 Įkiši - marma, ištrauki - varva

Vartotojui prieinama Skaitmeninė mįslių kartoteka - 60 000 mįslių duomenų bazė, apimanti visus išskirtus tipus ir jų versijas, atspindinti daugelį dešimtmečių Lietuvių literatūros ir tautosakos instituto kaupto mįslių masyvo sudėtį, turtingumą ir įvairovę (kol kas tik mįslių medžiaga iš LLTI saugomų Lietuvių mokslo draugijos ir Lietuvių tautosakos rankraštyno rinkinių). Vienoje vietoje pateikiama laisvai prieinama susisteminta didžioji dalis lietuvių objektų mįslių masyvo.

Lietuvių tautosakos archyvo schema

tags: #kaulo #burna #mesos #barzda #du #kartus