Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Spam filtering in social networks using regularized deep neural networks with ensemble learning
Autoři: Barushka Aliaksandr | Hájek Petr
Rok: 2018
Druh publikace: článek ve sborníku
Název zdroje: IFIP Advances in Information and Communication Technology. Vol. 519
Název nakladatele: Springer
Místo vydání: Heidelberg
Strana od-do: 38-48
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Filtrování spamu v sociálních sítích pomocí regularizovaných neuronových sítí souboru učení Filtrování spamu v sociálních sítích je stále důležitější díky rychlému růstu uživatelské základny v sociální sítích. Pro vyřešení tohoto složitého problému musí být vyvinuty sofistikované spamové filtry. Tradiční přístupy strojového učení, jako jsou neuronové sítě, podpůrný vektorový stroj a klasifikační systémy Naïve Bayes, nejsou dostatečně účinné k tomu, aby zpracovaly a využily složité atributy, které se vyskytují v rozsáhlých spamových datech na sociálních sítích. K řešení tohoto problému navrhujeme nový přístup k filtrování nevyžádané pošty v sociálních sítích. Tento přístup využívá metody učení pomocí souboru klasifikátorů s regularizovanými hlubokými neuronovými sítěmi jako základními klasifikátory. Ukazujeme, že tento přístup je účinný pro filtrování nevyžádané pošty ze sociálních sítí na základě benchmarkového souboru dat z hlediska přesnosti a plochy pod ROC. Kromě toho je dosaženo solidního výkonu z hlediska falešně negativních a falešně pozitivních klasifikací. Ukazujeme také, že navrhovaný přístup překonává jiné populární algoritmy používané při filtrování nevyžádané pošty, jako jsou rozhodovací stromy, Naïve Bayes, umělé imunitní systémy, podpůrné vektorové stroje atd.
eng Spam filtering in social networks using regularized deep neural networks with ensemble learning Spam filtering in social networks is increasingly important owing to the rapid growth of social network user base. Sophisticated spam filters must be developed to deal with this complex problem. Traditional machine learning approaches such as neural networks, support vector machine and Naïve Bayes classifiers are not effective enough to process and utilize complex features present in high-dimensional data on social network spam. To overcome this problem, here we propose a novel approach to social network spam filtering. The approach uses ensemble learning techniques with regularized deep neural networks as base learners. We demonstrate that this approach is effective for social network spam filtering on a benchmark dataset in terms of accuracy and area under ROC. In addition, solid performance is achieved in terms of false negative and false positive rates. We also show that the proposed approach outperforms other popular algorithms used in spam filtering, such as decision trees, Naïve Bayes, artificial immune systems, support vector machines, etc. Meta-learning; Neural network; Regularization; Social networks