სემინარები

სამეცნიერო სემინარის თემა: "სამეცნიერო მონაცემების შენახვა-დამუშავების პრობლემები მონაცემთა ბაზების მართვის სისტემებში" ზუსტ მეცნიერებათა და განათლების ფაკულტეტი კომპიუტერულ მეცნიერებათა დეპარტამენტის ასოცირებული პროფესორი ზებურ სურმანიძე 19 ივლისი,10:00 საათი, I კორპუსი, 65-ე აუდიტორია

ინტერნეტის ყველგან გავრცელებამ და ინფორმაციაზე დაჩქარებულმა წვდომამ გამოიწვია კიბერ საზოგადოების (საინფორმაციო საზოგადოების) კონცეფციის ჩამოყალიბება. მივიღეთ ცივილიზაციის განვითარების ახალი ისტორიული ფაზა, რომელშიც წარმოების ძირითადი პროდუქცია არის ინფორმაცია და ცოდნა.

ინფორმაციული საზოგადოების განუყოფელი ნაწილია ე.წ. e-Sciene - მეცნიერებისა და კომპიუტერული მეცნიერებების სინთეზი. განსაკუთრებით ეს აისახება საბუნებისმეტყველო მეცნიერებებში, რომლებიც მუშაობენ დიდი მოცულობის ინფორმაციასთან.

ყველა სამეცნიერო დაწესებულებაში მონაცემები წარმოდგენილია  მონაცემთა ბაზების სახით, რომელთა დამუშავება შეიძლება მონაცემთა ბაზების მართვის სისტემებით. მაგრამ ყველაზე გავრცელებული მონაცემთა ბაზების მართვის სისტემები, ჯერ-ჯერობით, ვერ უზრუნველყოფენ სამეცნიერო მონაცემების სრულყოფილ შენახვა-დამუშავებას. ცნობილია, რომ მონაცემთა ბაზებში მონაცემების შეტანისათვის საჭიროა რეალური მონაცემების ისეთი სახით წარმოადგინოთ, რომ შესაძლებელი იყოს მისი კომპიუტერში შეტანა-დამუშავება. ამის გაკეთება ხდება მონაცემების სტრუქტურირებულად წარმოდგენა სხვადსხვა მოდელებით. ვინაიდან სამეცნიერო კვლევებისას ჩვენ ტექნიკური მოწყობილობებიდან ვიღებთ ე.წ. „ნედლ“ მონაცემებს, რომელთა მოცულობა რამდენიმე ასეული ტერაბაიტია, ამიტომ ამ მონაცემების სტრუქტურირება ძალიან რთულია და დაკავშირებულია გარკვეული სახის პირველადი მონაცემების დაკარგვასთან. სწორედ ამ პრობლების გადასაწყვეტად შეიქმნა ახალი, მეცნიერებაზე ორიენტირებული მონაცემთა ბაზების მართვის სისტემა, რომელშიც შემოთავაზებულია მონაცემთა შენახვის პრინციპების ძირეული ცვლილებები. ასეთ პროგრამას წარმოადგენს SciDB სისტემა, რომელიც პრინციპულად განსხვავდება არსებული მონაცემთა ბაზების მართვის სისტემებისაგან.

დღეისათვის SciDB არის თავისუფლად გავრცელებადი (უფასო) პოსტ-რელაციური მონაცემთა ბაზების მართვის სისტემა, რომელიც შეიმუშავა კომპანია Paradigm4. ის განკუთვნილია დიდი მოცულობის სამეცნიერო მონაცემების მრავალგანზომილებიანი განაწილებული მასივების შენახვისა და დამუშავებისათვის. მასში მონაცემების შენახვა ორგანიზებულია მრავალგანზომილებიანი ჩალაგებული მასივების სახით, რომელთა დამუშავება ხორციელდება SQL, AQL (Array Query Language) და AFL (Array Functional Language) ენების საშუალებით.

SciDB-ში წარმოდგენილია მონაცემთან მუშაობის ახალი მექანიზმი, რომელიც განკუთვნილია სამეცნიერო მონაცემების ანალიზისათვის. მასში მონაცემთა მოდელი წარმოადგენს მრავალგანზომილებიან ჩადგმულ (ჩალაგებულ) მასივებს. ამიტომ მეცნიერებს არ სჭირდებათ თავიანთი მონაცემების მოდელირება, როგორც ჩანაწერთა ცხრილები, რაც აადვილებს ანალიტიკური მოთხოვნების მარტივად ფორმულირებას და ზრდის სისტემის მწარმოებულობას. ვინაიდან SciDB-ში ინახება მოწყობილობებიდან მიღებული მონაცემები, ამიტომ მასში მხარდაჭერილია მონაცემთა მოდელის და მოთხოვნების ენის დენეზე გაზომვების ცდომილება. SciDB-თან შეიძლება იმუშაოს გამოთვლითი ტექნიკის სხვადასხვა სისტემებმა (პერსონალური კომპიუტერი, სუპერკომპიუტერი და სხვა). ის ინტეგრირებულია სხვადასხვა პროგრამულ უზრუნველყოფასთან (მაგალითად, Matlab).

 მონაცემთა ბაზების მართვის სისტემა SciDB-ის ძირითადი თავისებურებებია:

  • სწრაფი ნავიგაცია მონაცემთა დიდ მოცულობაში ინდექსების გამოყენებით, რომელიც ეყრდნობა მასივებს;
  • „ნედლი“ მონაცემების შენახვა, მათი დამუშავება ხდება თვით მონაცემთა ბაზების მართვის სისტემაში სანამ მოხდება მისი გაცემა;
  • სამეცნიერო მონაცემების აღწერის მოდელი არის მრავალგანზომილებიანი ჩალაგებული მასივები;
  • მონაცემთა მაღალი შეკუმშვა, რომელიც განპირობებულია მასივების ვერტიკალური (ატრიბუტების მიხედვით) შენახვით;
  • მონაცემთა შენახვა უზრუნველყოფილია სისტემის სხვადასხვა დონეზე მონაცემთა რეპლიკაციით;
  • მონაცემთა ბაზების მართვის სისტემის მასშტაბურობა, დაწყებული ნოუთბუკიდან რამდენიმე ასეული სერვერით დამთავრებული, ამ უკანასკნელს შეუძლია 10 პეტაბაიტზე მეტი ინფორმაციის შენახვა/დამუშავება;
  • მონაცემთა ტიპების და მოთხოვნების გაფართოება;
  • ტრანზაქციებზე უარის თქმა;
  • თავდაპიველი კოდის ღიაობა.    

 ამრიგად სამეცნიერო მონაცემების შენახვა-დამუშავება, რომელიც ადრე კეთდებოდა მონაცემთა ბაზების მართვის სისტემის გარეთ, ანუ საწყისი მონაცემების მოდელირება იყო საჭირო მისი მონაცემთა ბაზების მართვის სისტემაში შენახვა-დამუშავებისათვის, SciDB-ში ეს პრობლემა გადაწყვეტილია საწყისი მონაცემების ეფექტური და მოხერხებულად შენახვა-დამუშავების ახალი სისტემით. ამ სისტემაში შესაძლებელია საწყისი მონაცემების მრავალჯერადი დამუშავება სხვადასხვა გამოთვლითი ტექნიკით და პროგრამული უზრუნველყოფით. პირველადი მონაცემების დამუშავების შემდეგ SciDB-ში შესაძლებელია ნებისმიერმა დაინტერესებულმა მომხმარებელმა (მეცნიერმა) შეასრულოს ანლიტიკური მოთხოვნები და მიიღოს შესაბამისი შედეგები. SciDB-ის სამეცნიერო საბჭოში შედის სხვადასხვა დარგის მეცნიერები, რომლებიც მუშაობენ მსოფლიოს წამყვან სამეცნიერო ცენტრებში.

  პრეზენტაცია

უკან

პოპულარული სიახლეები

საკონტაქტო ინფორმაცია

საქართველო, ბათუმი, 6010
ნინოშვილის/რუსთაველის ქ. 35/32
ტელ: +995(422) 27–17–80
ფაქსი: +995(422) 27–17–87
ელ. ფოსტა: info@bsu.edu.ge
     

სიახლის გამოწერა