Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Selection of Suitable PageRank Calculation for Analysis of Differences Between Expected and Observed Probability of Accesses to Web Pages
Autoři: Kapusta Jozef | Munk Michal | Svec Peter
Rok: 2018
Druh publikace: článek ve sborníku
Název zdroje: Multi-disciplinary Trends in Artificial Intelligence
Název nakladatele: Springer
Místo vydání: Heidelberg
Strana od-do: 139-150
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Výběr vhodného výpočtu PageRank pro analýzu rozdílů mezi očekávanou a zjištěnou pravděpodobností přístupu k webovým stránkám Popisujeme zde různé přístupy, jak vypočítat hodnotu PageRank. Existuje několik metod, jak vypočítat PageRank od základní historické až po vylepšené verze. Většina z nich používá původní hodnotu tlumícího faktoru. Popisujeme experiment, který jsme realizovali pomocí naší metody pro analýzu rozdílu mezi očekávanou a pozorovanou pravděpodobností přístupu na webové stránky vybraného portálu. Použili jsme pět mírně odlišných metod pro odhad PageRank pomocí původní hodnoty tlumícího faktoru a hodnoty vypočtené z dat v souboru protokolu webového serveru. Předpokládali jsme a potvrdili, že odhad / výpočet tlumícího faktoru by měl významný dopad na odhad PageRank. Nesprávně jsme také předpokládali, že odhad / výpočet tlumícího faktoru by měl významný dopad na počet podezřelých stránek. Porovnali jsme také výpočetní složitost použitých metod PageRank a nejefektivnější metoda se zdá být metodou s odhadovanou hodnotou tlumícího faktoru.
eng Selection of Suitable PageRank Calculation for Analysis of Differences Between Expected and Observed Probability of Accesses to Web Pages We describe various approaches how to calculate the value of PageRank in this paper. There are few methods how to calculate the PageRank, from the basic historical one to more enhanced versions. Most of them are using the original value of the damping factor. We describe the experiment we realised using our method for analysing differences between expected and observed probability of accesses to web pages of the selected portal. We used five slightly different methods for PageRank estimation using both the original value of damping factor and the value calculated from data in the web server log file. We assumed and confirmed that the estimation/calculation of the damping factor would have a significant impact on the estimation of the PageRank. We also wrongly assumed that the estimation/calculation of the damping factor would have a significant impact on the number of suspicious pages. We also compared the computational complexity of used PageRank methods, and the most effective method seems to be a method with the estimated value of the damping factor. Web usage mining; Web structure mining; PageRank; Damping factor; Support; Observed visit rate; Expected visit rate