ქართული   English

შოთა რუსთაველის ქართული ლიტერატურის ინსტიტუტის

ფოლკლორის არქივი

მთავარი

ისტორია პროექტები მონაცემთა ბაზა ბიბლიოთეკა

მულტიმედია

პერსონალი კონტაქტი    ბმულები

"პეტრე უმიკაშვილის ხელნაწერთა კოლექციის (XIX ს.) ელექტრონული დამუშავება"

(დასკვნითი სამეცნიერო ანგრიში)

I  ზოგადი

პროექტი ითვალისწინებდა ქართული ფოლკლორული ჩანაწერების ერთ-ერთი უძველესი კორპუსის, პეტრე უმიკაშვილის ხელნაწერი კოლექციის (მე-19 ს.) დიგიტალიზაციას, დიგიტალიზებული მასალის რაოდენობრივი მახასიათებლების მიხედვით სისტემატიზაციას, ხელნაწერი ფრაგმენტების გრაფიკული ფაილების სახით გამთლიანებას, ამგვარად იდენტიფიცირებული ტექსტების თემატურ-ჟანრობრივი და მასთან სხვა მონაცემების მიხედვით აღწერას და მონაცემემების ელექტრონულ მაზაში შეტანას.

 

პრობლემის აქტუალობა განპირობებული იყო ხელნაწერებზე გასული საუკუნის 30-იან წლებში განხორციელებული იმ არასწორი სარედაქციო საქმიანობით, რამაც გამოიწვია ხელნაწერი ორიგინალების დაჭრა-დანაკუწება. საქმე ისაა, რომ პეტრე უმიკაშვილი მასალებს კრებდა როგორც თვითონ, ისე კორესპოდენტების მეშვეობით. ამის გამო ხელნაწერები იმთავითვე არ ყოფილა ჰომოგენური, როგორც საწერი მასალის ზომის, ისე ნაწერი მხარეების რაოდენობის თვალსაზრისით. არაჰომოგენური ბუნების გამო, კოლექციის გამოსაქვეყნებლად მომზადება საჭიროებდა ტექსტების დიდი უმრავლესობის ცალკე გადაწერას. დროის უქონლობამ, როგორც ჩანს, გამომცემელი იძულებული გახადა აერჩია კომპრომისული გამოსავალი და ერთსა და იმავე გვერდზე მოთავსებული რამდენიმე ტექსტის ურთიერთისაგან დასაცალკევებლად დაეჭრა ხელნაწერთა დედნები.

 

განვიხილოთ ასეთი მაგალითი: ვთქვათ, ერთ ფურცელზე ჩაწერილია ორი ან ორზე მეტი (A, B, C...n) ტექსტი, რომელთაგან, A ტექსტი მთლიანად და B ტექტის ნაწილი მოთავსებულია ფურცლის მარჯვენა, ხოლო დანარჩენი  ფურცლის  მარცხენა გვერდზე. იმ შემთხვევაში, თუ გამომცემელი ცალკე გამოყოფს A ტექსტს, ეს ავტომატრად გამიწვევს B და/ან C ტექსტის ნაწილებად დაფანტვას. ამგვარად, დანაწევრებული ტექსტების დიდი რაოდენობა იქცევა სხვადასხვა ადგილას გაფანტულ მცირე ზომის ფრაგმენტებად, რომელთა პირვანდელი სახით გაერთიანება, აღნიშნულ ფრაგმენტთა განსაკუთრებული სიმრავლის პირობებში მოითხოვს ტექსტოლოგიური საქმიანობის ახალი პრინციპების დანერგვას.

 

II  ხელნაწერი ფრაგმენტების იდენტიფიკაციის პროგრამა „Umikashvili – 2008“

IT პროგრამისტებთან თანამშრომლობით პროექტის ფარგლებში შეიქმნა ელექტრონული პროდუქტი „Umikashvili – 2008“  რომლის ფუნქციებად განისაზღვრა:

  • დასკანირებული და ფოტომასალის საწყისი დამუშავება,

  • ხელნაწერ ფრაგმენტთა გრაფიკული გამოსახულებების ძებნა და ანალიზი,

  • ფრაგმენტების შეწებება და კრებულების გაერთიანება,

  • ფორმულის და შესაბამისი PDF ფაილის გენერაცია და კორექცია.

განვიხილავთ თითოეულ ფუნქციას ცალ-ცალკე:

 

1. დასკანირებული და ფოტომასალის საწყისი დამუშავება. საწყისი დამუშავება ხორციელდება სპეციალურ ფანჯარაში – ოპერატორის სამუშაო ფორმაში. ოპერატორის სამუშაო ფორმა მოიცავს სამ ნაწილს. გამოსახულება, ძირითადი ინფორმაცია და პირველადი (ნახევრადავტომატური) ანალიზის ფორმა (იხ. სურათი 1). გამოსახულების ფორმიდან ხდება გამოსახულების ვიზუალური დათვალიერება, საჭიროების შემთხვევაში ხელახალი დასკანირება ან დისკიდან ჩატვირთვა. ასევე ინსტრუმენტთა პანელზე მოთავსებული სამკუთხედისა და ოთხკუთხედის ინსტრუმენტის მეშვეობით ფურცლის ფორმისა და საინტერესო ადგილების აღრიცხვა.

სურათი 1. „Umikashvili – 2008“ დასკანერებული და ფოტომასალის პირველადი დამუშავების ფანჯარა

 

ძირითადი ინფორმაციის ნაწილს ავსებს ოპერატორი დასკანერებული ხელნაწერის მახასიათებელთა შესაბამისად. ძირითადი ინფორმაცია მოიცავს ისეთ პარამეტრებს როგორიცაა დოკუმენტის დასახელება, მიმართება წინა და შემდეგ გვერდებთან, გვედის ნომერი, დოკუმენტის ნომერი და ა.შ.

 

 პირველადი (ნახევრადავტომატური) ანალიზის ფორმის მეშვეობით ხორციელდება გამოსახულების ისეთი პარამეტრების განსაზღვრა როგორიცაა გამოსახულების ზომა, ფერი და ა.შ. ფერის ამორჩევა შესაძლებელია როგორც ხელით, ასევე ავტომატური განსაზღვრის რეჟიმში. ასევე აღიწერება საინტერესო ადგილებისა და კუთხეების ჩამონათვალი. საინტერესო ადგილის მონიშვნა ხდება შემდეგნაირად: ოპერატორი ირჩევს ოთხკუთხედის ინსტრუმენტს და გამოსახულებაზე მონიშნავს საინტერესო ადგილის შემომსაზღვრელი მართკუთხედის მოპირდაპირე დიაგონალურ წერტილებს და საინტერესო ადგილის ტიპს (მაგ. ბეჭედი, ფაქსიმილე, გვერდის ნომერი და ა.შ.). პროგრამა ამ წერტილებით აღწერილი მართკუთხედს და მასთან დაკავშირებულ ინფორმაციას ინახავს მონაცემთა ბაზაში. ამ ინფირმაციის საფუძველზე შემდგომში ხორციელდება ძებნა და კომპლექსური ანალიზი (უკვე ექსპერტის მიერ).

 

2. ძებნა და ანალიზი. ხორციელდება სპეციალურ ფორმაში რომლის მეშვეობითაც ხდება ფილტრაცია ნებისმიერი პარამეტრის მიხედვით. არჩეული პარამეტრებით ხორციელდება ინფორმაციის ძებნა მონაცემთა ბაზაში და შესაბამისი სია მომხმარებელს გამოსდის ცხრილის სახით (იხილეთ სურათი 2).

სურათი 2. „Umikashvili – 2008“ ძებნისა და ანალიზის  ფანჯარა

 

არჩეული პარამეტრები ერთმანეთთან ქმნიან „და“ კავშირს. ასევე კრებული და გვერდის შემთხვევაში შესაძლებელია ტექსტის ნაწილის მიხედვით მოძებნა და საძებნი პარამეტრების „ან“ კავშირით დაკავშირება. მომხმარებელს ასევე საშუალება აქვს მოახდინოს შედეგების ექსპორტი  Excel–ის  ფორმატის დოკუმენტში და გამოიყენოს იგი სურვილისამებრ.

 

 3. ფრაგმენტების შეწებება და კრებულების გაერთიანება. ფუნქციონალობა ექსპერტს საშუალებას აძლევს ძებნის შედეგად გამოტანილი ფრაგმენტები გააერთიანოს ერთ გვერდად და შეინახოს გაერთიანებული გვერდი მონაცემთა ბაზაში (იხ. სურათი 3). სასურველი ფრაგმენტების მონიშვნა ძებნის შედეგების ცხრილში ხდება „Control“ ღილაკისა და მაუსის საშუალებით, რის შემდეგაც ექსპერტი ირჩევს ღილაკს „მონიშნულის გაერთიანება“.

სურათი 3. „Umikashvili – 2008“ ხელნაწერი ფრაგმენტების აღდგენის  ფანჯარა

 

გაერთიანებისას მონიშნული ფრაგმენტები ერთმანეთის მიმართ განლაგდება ექსპერტის სურვილისამებრ და საბოლოოდ შექმნიან ერთ მთლიან გვერდს, რომლის ძირითადი პარამეტრები განისაზღვრება ფირველადი ფრაგმენტებისაგან დამოუკიდებლად. იმ ფრაგმენტებს რომლებიც გაერთიანდნენ სხვა გვერდად მიეცემა წითელი შეფერილობა და მიეთითება მიღებული გაერთიანებული გვერდის (კრებულის) ნომერი.

 ასევე შესაძლებელია ერთი კრებულის მეორესთან გადაბმა. ექსპერტი ძებნის ფანჯარაში ირჩევს იმ გვერდს რომლესაც უნდა მოჰყვებოდეს სასურველი კრებული, აწვება ღილაკს „მონიშნულის გაგრძელება“ და დიალოგურ ფანჯარაში წერს იმ კრებულის ნომერს რომლითაც უნდა გრძელდებოდეს მონიშნული გვერდი. იმ გვერდს რომლები გაგრძელდება სხვა კრებულით მიეცემა ლურჯი შეფერილობა და მიეთითება გაგრძელებული კრებულის ნომერი.

 

4. ფორმულის და შესაბამისი PDF ფაილის გენერაცია და კორექცია. ფორმულა წარმოდგენს სტრიქონს რომელიც ასახავს საბოლოო კრებულის გვერდების განლაგებას და დამოკიდებულებას ერთმანეთის მიმართ (სინამდვილეში ფორმულა არის ექსპერტის მუშაობის შედეგი და იძლევა რესტავრირებული დოკუმენტის სრულ აღწერილობას). ფორმულის გენერაცია (ეკრანზე გამოტანა) ხდება ძებნის ფანჯარის ქვედა ნაწილში (იხ. სურათი 2). მისი გენერაციის დროს ხდება გაერთიანებული ფრაგმენტებისა და გადაბმული კრებულების გათვალისწინება. ფორმულის კორექტირება შესაძლებელია კონკრეტული გერდის სამუშაო ფანჯრის მეშვეობით. შესაძლებელია ასევე მოცემული კრებულის შესაბამის PDF ფაილად გენერაცია. ფაილში გვერდების მიმდევრობის დალაგება ხორციელდება ანალოგიური ალგორითმით, როგორც ფორმულის გენერაციის შემთხვევაში. მიღებული ფაილი ინახება დისკზე შემდგომი გამოყენების მიზნით.

 

III  ხელნაწერთა დიგიტალიზაცია და კონსერვაცია

ელექტრონულ პროდუქტზე მუშაობის პერიოდში მიმდინარეობდა ხელნაწერი კოლექციის სხვადასხვა ტიპის მასალებად გადარჩევა. ასეთია ლიტერატურული მემკვიდრეობა, სხვადასხვა საბუთები, კონსპექტები, ეპისტოლარული მემკვიდრეობა და ფოლკლორი. მათგან დასასკანერებლად მომზადდა უმიკაშვილის კოლექციაში დაცული ფოლკლორული მასალა (იმ ხელნაწერები გამოკლებით რომლებიც გადაწერილი იყო რედაქტორების ფილიპე გოგიჩაიშვილის და მიხეილ ჩიქოვანი მიერ. ასევე ცალკე გამოიყო უმიკაშვილის კოლექციის ეპისტოლარული მემკვიდრეობის ის ნაწილი, რომელიც წარმოადგენს უმიკაშვილის კერძო წერილების პაპიროსის ქაღალდზე გადატანილ ასლებს. პროექტი მიხედვით მოგვიანებით დაიწყო აღნიშნული წერილების მინის  პაკეტებში კონსერვაცია, რაც საბოლლოოდ დასრულდა პროექტის განხორციელების VI კვარტალში. 23X33სმ. ზომის 558 ცალ მინაპაკეტებში განთავდა 165 ერთეული წერილი, რითაც სრულად იქნა უზრუნველყოფილი მათი უსაფრხო ექსპლუატაცია.

 

 ელექტრონული პროდუქტის გამოყენება დაიწყო პროექტის განხორციელების V კვარტლიდან. არსებული გეგმის შესაბამისად.  6 თვის განმავლობაში ოპერატორის მიერ დასკანერდა და ფოტოგრაფირებული იქნა 10 000-მდე ერთეული სხვადასხვა ზომის  ხელნაწერი გვერდი. მოხდა თითოელი ასეთი ხელნაწერის ავტომატურ და ნახევრადავტომატურ რეჟიმში აღწერა.

 

 პარალელურად ხორციელდებოდა დასკანერებული ხელნაწერების საკონსერვაციო სამუშაოები, სკანირების დასრულების შემდეგ, სპეციალურ ყდებში შესანახად მომზადდა და რკინის კარადაში განთავსდა უმიკაშვილის ხელნაწერი კოლექციის ფოლკლორული მემკვიდრეობა.

 

IV  ხელნაწერი ფრაგმენტების იდენტიფიკაცია და ხელნაწერი კრებულების პირვანდელი სახით აღდგენა

პროექტის VI ეტაპიდან დაიწყო ხელნაწერთა ფრაგმენტების იდენტიფიკაციის სამუშაოები. მოხერხდა ყველა არსებული ფრაგმენტის ერთმანეთთან დაკავშირება, თუმცა დაფიქსირდა ისეთი შემთხვევებიც, როცა ხელნაწერი ფურცლის ან კრებულის რაღაც ნაწილის მოძიება საერთოდ არ ხერხდება.

 

 ხელნაწერთა ფრაგმენტების იდენტიფიკაციის საფუძველზე განხორციელდა ერთმანეთს დაშორებული ნაწილების ერთმანეთთან დაკავშირება, რის შემდეგაც მოხდა ხელნაწერი კრებულების პირვანდელი სახით აღდგენა. აღდგენილი კრებულები წარმოადგენს pdf გაფართოების მქონე დიგიტალურ ფაილებს, რომელთა საერთო რაოდენობა უდრის 431 ერთეულს.

 

V  ფოლკლორული ტექსტების კომპლექსური სისტემატიზაცია და მონაცემების ელექტრონულ ბაზაში შეტანა

კრებულების აღდენის პარალელურად მიმდინარეობდა მათში თავმოყრილი ფოლკლორული ტექსტების თემატური, ჟანრული და სხვა შინაარსობლივ-ფორმალური მახასიათებლების მიხედვით დამუშავება და დამუშავებული ინფორმაციის  ფოლკლორის მონაცემთა კომპიუტერულ ბაზაში შეტანა. ამ მიზნით გამოიყენებულ იქნა საარქივო ფოლკლორული მასალების სისტემატიზაციის კომპიუტერული პროგრამა „Folklore DS 2-3“ (ავტორები: ელგუჯა დადუნაშვილი და რატი სხირტლაძე).

 

 პროექტის რეალიზაციის საბოლოო ეტაპზე 26 ფორმალური და შინაარსობლივი ნიშნის მიხედვით დახასიათდა, აღიწერა და მონაცემთა ელექტრონულ ბაზაში შევიდა დიდი თუ მცირე მოცულობის 6018 ერთეული ფოლკლორული ტექსტი. მათ შორის, აარნე-თომპსონ-უთერის მოტივთა საერთაშორი საძიებო ინდექსის მიხედვით დახასიათებული და აღწერილი იქნა 353 ერთეული პროზაული ტექსტი. მონაცემთა ერთი ნაწილი გადაიტვირთა და განთავსდა ქართული ფოლკლორის ქსელურ ბაზაში: www.acnet.ge/folklore

საარქივო ფოლკლორული მასალების მონაცემთა ბაზის პოლიფუნქციური არაქსელური ვერსიით სარგებლობა შესაძლებელია შოთა რუსთაველის ქართული ლიტერატურის ინსტიტუტის ფოლკლორის არქივში.

სურათი 3. „DS Folklore2.3“ საარქივო ფოლკლორული მასალების სისტემატიზაციის კომპიტერული პროგრამა

 

მონაცემთა ბაზის თითოეულ ჩანაწერს დართული აქვს აღწერილი ტექსტის pdf გრაფიკული ფაილის ლინკი (იხ. სურათი 4), რომელის მეშვეობითაც შესაძლებელია პროექტის ფარგლებში აღდგენილი ხელნაწერი კრებულის შესაბამის გვერდის ნახვა და ჩამოტვირთვა.

ამრიგად შესრულებულია პროექტით განსაზღვრული ყველა ამოცანა და  მიღწეულია მისი ძირითადი მიზანი. პროექტით დასახული მიზნის შესაბამისად უზრუნველყოფილია იქნეს პერტე უმიკაშვილის ხელნაწერთა კოლექციის ფოლკლორული მემკვიდრეობის სრულ ხელმისაწვდომობა.

1996-2013

© ელგუჯა დადუნაშვილი, © მარინე ტურაშვილი

ფონად გამოყენებულია ილია ჭავჭავაძის ავტოგრაფი. ხელნაწერი დაცულია ფოლკლორის არქივში, პეტრე უმიკაშვილის კოლექციაში.