Options
Daugiamačių duomenų rinkinių tyrimas taikant modifikuotą Renyi-CLIPx klasterizacijos algoritmą
Ramašauskas, Olegas | Recenzentas / Rewiewer |
Denisov, Vitalij | Recenzentas / Rewiewer |
Ramašauskas, Olegas | Darbo gynimo komisijos pirmininkas / Thesis Defence Board Chairman |
Bielskis, Andrius | Darbo gynimo komisijos narys / Thesis Defence Board Member |
Lebedeva, Galina | Darbo gynimo komisijos narys / Thesis Defence Board Member |
Baziukaitė, Dalia | Darbo gynimo komisijos narys / Thesis Defence Board Member |
Šiame baigiamajame magistro darbe didžiausias dėmesys skirtas daugiamačių duomenų rinkinių analizei, kuriai atlikti naudojami konceptualios klasterizacijos algoritmai. Tokia analizė susideda iš dviejų esminių dalių – tai klasterių duomenų rinkinyje radimo ir klasterius aprašančių taisyklių suformavimo. Analizuojami duomenų rinkiniai gali būti įvairūs. Šiuo atveju mus labiausiai domino realių iš virtualios mokymo(si) aplinkos gaunamų duomenų rinkinių, aprašančių besimokančiųjų pasiekimus, analizė. Algoritmu gautų rezultatų gerumas papildomai buvo patikrintas testuojant duomenų rinkinį su įvardintu klasės atributu. Tai leido įsitikinti gautų rezultatų patikimumu. Realizuoti algoritmai ir atlikto tyrimo rezultatai svarbūs adaptyvios intelektualios virtualios mokymo(si) aplinkos kūrimo etape bei bus naudinga algoritmus diegiant realioje VMA. Tai taip pat sukurs prielaidas kokybiškesnėms savarankiškoms studijoms, kai yra taikomos šiuolaikinės informacinės komunikacinės technologijos. Darbe analizuotų Renyi entropijos, ITERATE, CLIP3 ir CLIP4 klasterizacijos algoritmų pagrindu, sudarytas modifikuotas Renyi-CLIPx klasterizacijos algoritmas, kuris pagerina sudaromų klasterių ir taisyklių kokybę virtualios mokymo(si) aplinkos bei kitokios prigimties duomenų rinkiniams.
In this master’s paper a great attention is paid for multidimensional data analysis by conceptual clustering algorithms. This analysis includes two aspects: discovering of clusters and clustering rules form various data sets. These rules help to decide to which cluster newly appearing object has to be assigned. We also are interested in analysis of virtual learning system’s data sets which contains such information as grades of students. Clustering results are tested by using training data which real clusters are well known. Made results indicates about a very good clustering solution. Discovered algorithms and results of experiments are important for developing of virtual learning system. We suppose that it is useful for making better self-studies with modern communication technologies. Modified Renyi-CLIPx clustering algorithm is proposed as result of analysis Renyi entropy, ITERATE, CLIP3 and CLIP4 clustering algorithms. It is used to discover better clusters and create rules for virtual learning and other data sets.