ინგლისურ-ქართული პარალელური კორპუსი

2011 წელს დაგვებადა სურვილი ძალები მოგვესინჯა კორპუსულ ლინგვისტიკაში და შეგვექმნა ორენოვანი ინგლისურ-ქართული პარალელური კორპუსი. ამგვარი კორპუსის შექმნას განსაკუთრებულ სტიმულს აძლევდა ბატონი არიანე ჭანტურიას უდიდესი მთარგმნელობითი მოღვაწეობის უკვდავყოფისა და მისი თარგმანების პარალელურ კორპუსად გარდაქმნის სურვილი. ბატონ არიანეს გავანდეთ ეს სურვილი. ძალიან მოეწონა იდეა და თავად მისი მონაწილეობით შევადგინეთ არიანე ჭანტურიას თარგმანების კატალოგი, რაც პარალელურ კორპუსში უნდა შესულიყო.

ჩვენ მიერ პარალელური კორპუსის შექმნის იდეა ძალიან წაახალისა საქართველოში კორპუსული ლინგვისტიკის ერთ-ერთი პიონერის, მარინე ბერიძის მიერ 2011 წელს ჩატარებულმა საერთაშორისო კონფერენციამ „ქართული ენა და ტექნოლოგიები“. სწორედ ამ კონფერენციაზე მოვისმინეთ რამდენიმე საინტერესო მოხსენება პარალელურ კორპუსზე და გავიცანით დიმიტრი სიჭინავა, რუსული და უკრაინული ეროვნული კორპუსების ერთ-ერთი შემქმნელი. ჩვენი შთაგონების წყაროდ ასევე იქცა თავად მარინე ბერიძის მიერ შექმნილი ქართული ენის დიალექტური კორპუსი. 2012 წელს ბათუმში ჩატარებულ მეორე საერთაშორისო სიმპოზიუმზე ლექსიკოგრაფიაში დიმიტრი სიჭინავამ წაიკითხა მოხსენება მის მიერ შექმნილ პარალელურ კორპუსებზე, შემდეგ კი თბილისში, ჩვენი მოწვევით, რამდენიმე საინტერესო ლექცია ჩაატარა კორპუსული ლინგვისტიკის საკითხებზე. დიმიტრი სიჭინავამ ჩვენს გუნდთან რამდენიმე სამუშაო შეხვედრა გამართა და ჩვენს პროგრამისტს, გიორგი ქერეჭაშვილს პარალელური კორპუსის შესაქმნელი საინტერესო პროგრამული ინსტრუმენტების შესახებ მიაწოდა ინფორმაცია. სწორედ ამ პროგრამული ინსტრუმენტების გამოყენებით შექმნა გიორგიმ მოგვიანებით პარალელური კორპუსის პლატფორმა და ჩვენც დავიწყეთ მასში არიანე ჭანტურიას თარგმანების გადატანა.

დღეისათვის ინგლისურ-ქართულ პარალელურ კორპუსში 2.5 მილიონი სიტყვაფორმაა. კორპუსს აქვს ორი ქვეკორპუსი: სამეცნიერო ტექსტების ქვეკორპუსი და მხატვრული ლიტერატურის ქვეკორპუსი. მხატვრული ლიტერატურის ქვეკორპუსის შევსება დავიწყეთ დიდი ბრიტანელი ქართველოლოგის დონალდ რეიფილდის თარგმანებით. როდესაც მე მას მივწერე და ვთხოვე გადმოეცა ჩვენი კორპუსისთვის მისი თარგმანები, არც კი დაფიქრებულა ისე გამოგვიგზავნა მის მიერ თარგმნილი ოთარ ჭილაძის რომანები („აველუმი“, „გზაზე ერთი კაცი მიდიოდა“) და მიხეილ ჯავახიშვილის „კვაჭი კვაჭანტირაძე“. ასევე დიდი მადლობა უნდა ვუთხრა სულაკაურის გამომცემლობის დირექტორს, ქალბატონ თინა მამულაშვილს, რომელიც დაგვთანხმდა პარალელური კორპუსისთვის გადმოგვცეს მათ მიერ გამოცემული თარგმანები.

ქვემოთ მოცემულია ბმული ჩემს სტატიაზე, რომელიც რამდენიმე წლის წინ დაიწერა და ცოტა მოძველდა, მაგრამ მასში აღწერილია პარალელური კორპუსის მოწყობის პრინციპები.

paralelkorpus.pdf


პარალელური კორპუსი განთავსებულია მისამართზე: http://corp.dict.ge

* * *

პარალელური კორპუსის პროექტზე სხვადასხვა დროს მუშაობდნენ ლექსიკოგრაფიის სადოქტორო პროგრამის სტუდენტები.

2015 წელს გავაცნობიერეთ, რომ ინგლისურ-ქართულ პარალელურ კორპუსში დიდძალი ტერმინოლოგია დაგროვდა მეცნიერებისა და ტექნიკის თითქმის ყველა დარგიდან, ქართული ტერმინოლოგია ინგლისური თარგმანებით. გადავწყვიტეთ კოპუსის ახალი მოდულის შექმნა, რომელსაც ‘ტერმინოლოგიური მოდული’ ვუწოდეთ.

პარალელურ კორპუსს დაემატა დეტალური ძიების ფუნქცია, რომლის მეშვეობითაც შესაძლებელია ტერმინოლოგიის ამოკრეფა კორპუსიდან დარგების მიხედვით. მას შემდეგ ჩვენი სამაგისტრო პროგრამის სტუდენტები, ჩვენ მიერ შემუშავებული მეთოდოლოგიით, იღებენ კორპუსიდან ტერმინოლოგიას, ამუშავებემ მას ლექსიკოგრაფიულად და ქმნიან ტერმინოლოგიურ სიტყვა-სტატიებს. ამ სიტყვა-სტატიებს შემდეგ რედაქციას უკეთებს ჩვენი ტერმინოლოგი გელა ხუნდაძე და მასალა იტვირთება შესაბამის ლექსიკონში.

ტერმინოლოგიური მოდულის შესახებ 2015 წლის სექტემბერში, საერთაშორისო კონფერენციაზე „ენა და თანამედროვე ტექნოლოგიები“,წავიკითხე მოხსენება: „ინგლისურ-ქართული სამეცნიერო ტექსტების პარალელური კორპუსის პლატფორმა და დარგობრივი ლექსიკოგრაფია“. კონფერენციის ორგანიზატორები იყვნენ: ივ. ჯავახიშვილის სახელობის თბილისის სახელმწიფო უნივერსიტეტი, გოეთეს სახელობის ფრანკფურტის უნივერსიტეტი და არნ. ჩიქობავას სახელობის ენათმეცნიერების ინსტიტუტი.

 

 

 

 

 


 
დიზაინი და პროგრამირება: კობა თირქია