Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Comparison of fake and real news based on morphological analysis
Autoři: Kapusta Jozef | Hájek Petr | Munk Michal | Benko Lubomír
Rok: 2020
Druh publikace: článek ve sborníku
Název zdroje: Procedia Computer Science : Third International Conference on Computing and Network Communications (CoCoNet'19)
Název nakladatele: Elsevier Science BV
Místo vydání: Amsterdam
Strana od-do: 2285-2293
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Porovnání falšených a skutečných zpráv založené na morfologické analýze Snadný přístup k informacím vede k tomu, že se falešné zprávy záměrně šíří prostřednictvím sociálních sítí a manipulují s názory lidí. Detekce falešných zpráv v poslední době přitahuje rostoucí zájem široké veřejnosti a výzkumných pracovníků. Příspěvek se zabývá morfologickou analýzou dvou datových souborů obsahujících 28 870 zpravodajských článků. Výsledky byly ověřeny pomocí třetího souboru údajů, který se skládá ze 402 zpravodajských článků. Analýza datových souborů byla provedena pomocí lemmatizace a POS. Morfologická analýza jako proces klasifikace slov do gramaticko-sémantických tříd a přiřazení gramatických kategorií k těmto slovům. Jednotlivá slova z článků byla anotována a byly zkoumány statisticky významné rozdíly mezi třídami nalezenými ve falešných a skutečných zpravodajských článcích. Výsledky analýzy ukazují, že statisticky významné rozdíly jsou hlavně ve slovesných a podstatných třídách slov. Nalezení statisticky významných rozdílů v jednotlivých kategoriích tříd slov je důležitou informací pro budoucího klasifikátora falešných zpráv, pokud jde o výběr vhodných proměnných pro klasifikaci.
eng Comparison of fake and real news based on morphological analysis Easy access to information results in the phenomenon of false news spreading intentionally through social networks to manipulate people's opinions. Fake news detection has recently attracted growing interest from the general public and researchers. The paper deals with the morphological analysis of two datasets containing 28 870 news articles. The results were verified using the third dataset consisting of 402 news articles. The analysis of the datasets was carried out using lemmatization and POS tagging. The morphological analysis as a process of classifying the words into grammatical-semantic classes and assigning grammatical categories to these words. Individual words from articles were annotated and statistically significant differences were examined between the classes found in fake and real news articles. The results of the analysis show that statistically significant differences are mainly in the verbs and nouns word classes. Finding statistically significant differences in individual categories of word classes is an important piece of information for the future fake news classifier in terms of selecting appropriate variables for the classification. fake news; identification; text mining; natural language processing; post-editing; POS tagging; morphological analysis