Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Quantitative and Qualitative Evaluation of Sequence Patterns Found by Application of Different Educational Data Preprocessing Techniques
Autoři: Munk Michal | Drlik Martin | Benko Ľubomír | Reichel Jaroslav
Rok: 2017
Druh publikace: článek v odborném periodiku
Název zdroje: IEEE ACCESS
Název nakladatele: IEEE (Institute of Electrical and Electronics Engineers)
Místo vydání: New York
Strana od-do: 8989-9004
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Kvantitativní a kvalitativní vyhodnocení sekvenčních vzorů zjištěných aplikací různých předzpracovacích technik vzdělávacích dat Príprava edukačných dát z logovacích súborov predstavuje časovo náročnú fázu v procese objavovania znalostí. Pozostáva z čistenia dát, identifikácie používateľov, sedení a dopĺňania ciest. Tento článok sa snaží identifikovať fázy, ktoré sú potrebné v prípade prípravy edukačných dát pre ďalšiu aplikáciu analytických metód. Keďže je analýza sekvenčných vzorov považovaná za vhodnú na odhad objavených znalostí, tak sa tento článok snaží odpovedať na otázku, ktorá z týchto fáz prípravy dát má vo všeobecnosti významný vplyv na získané znalosti v zmysle kvality a kvantity nájdených sekvenčných vzorov. Preto boli na prípravu logovacích súborov na rôznych úrovniach prípravy dát zvolené viaceré techniky identifikácie sedení a dopĺňania ciest. Výsledky ukázali, že identifikácia sedení pomocou metódy Reference Length, vypočítaná z mapy webu, má významný vplyv na kvalitu extrahovaných sekvenčných pravidiel. Technika dopĺňania ciest mala značný vplyv iba na kvantitu extrahovaných sekvenčných pravidiel. Nadobudnuté výsledky spolu s výsledkami predchádzajúceho systematického výskumu v príprave edukačných dát, môžu zlepšiť automatizáciu fázy prípravy edukačných dát, ako aj môžu prispieť k rozvoju nástrojov na analýzu vzdelávania, vhodných pre rôzne skupiny zainteresovaných strán zaoberajúcich sa výskumom v oblasti objavovania znalostí v doméne vzdelávania. Výpočetní inteligence; umělá inteligence; předzpracování dat
eng Quantitative and Qualitative Evaluation of Sequence Patterns Found by Application of Different Educational Data Preprocessing Techniques Educational data preprocessing from log files represents a time-consuming phase of the knowledge discovery process. It consists of data cleaning, user identification, session identification, and path completion phase. This paper attempts to identify phases, which are necessary in the case of preprocessing of educational data for further application of learning analytics methods. Since the sequential patterns analysis is considered suitable for estimating of discovered knowledge, this paper tries answering the question, which of these preprocessing phases has a significant impact on discovered knowledge in general, as well as in the meaning of quality and quantity of found sequence patterns. Therefore, several data preprocessing techniques for session identification and path completion were applied to prepare logfiles with different levels of data preprocessing. The results showed that the session identification technique using the reference length, calculated from the sitemap, had a significant impact on the quality of extracted sequence rules. The path completion technique had a significant impact only on the quantity of extracted sequence rules. The found results together with the results of the previous systematic research in educational data preprocessing can improve the automation of the educational data preprocessing phase as well as it can contribute to the development of learning analytics tools suitable for different groups of stakeholders engaged in the educational data mining research activities. Computational and artificial intelligence; data preprocessing; educational technology; learning; learning systems; sequential analysis; web mining