Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Word Categorization of Corporate Annual Reports for Bankruptcy Prediction by Machine Learning Methods
Autoři: Hájek Petr | Olej Vladimír
Rok: 2015
Druh publikace: článek ve sborníku
Název zdroje: Text, Speech, and Dialogue: 18th International Conference, TSD 2015 Proceedings
Název nakladatele: Springer
Místo vydání: Berlin
Strana od-do: 122-130
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Slovní kategorizace podnikových výročních zpráv pro predikci bankrotu pomocí metod strojového učení Jazyk podnikových dokumentů je důležitým indikátorem budoucí finanční výkonnosti. Tato studie si klade za cíl extrakci různých slovních kategorií z výročních zpráv a testovat jejich vliv na predikci bankrotu. Ukazujeme, že jazyk použitý bankrotujícími podniky je charakteristický silnější neústupností, orientací na dosahování cílů, důvěrností, orientací na současnost, vyloučení a odmítání. Bankrotující podniky také používají více modálních slov, pozitivních, neurčitých a negativních slov. Použili jsme pro predikci neuronové sítě, podpůrné vektorové stroje, rozhodovací stromy a soubory rozhodovacích stromů. Predikční modely využívaly jak finančních indikátorů, tak slovních kategorizací jako vstupních proměnných. Přesnost predikce lze významně zvýšit použitím obecných slovníků i kategorií z finančních slovníků. predikce bankrotu; slovní kategorizace; analýza sentimentu; strojové učení; metaučení
eng Word Categorization of Corporate Annual Reports for Bankruptcy Prediction by Machine Learning Methods The language of company related documents is recognized as being an important indicator of future financial performance. This study aims to extract various word categories from corporate annual reports and examine their effect on bankruptcy prediction. We show that the language used by bankrupt companies is characterized by stronger tenacity, accomplishment, familiarity, present concern, exclusion and denial. Bankrupt companies also use more modal, positive, uncertain and negative language. We used neural networks, support vector machines, decision trees and ensembles of decision trees to predict corporate bankruptcy. The prediction models utilized both financial indicators and word categorizations as input variables. We show that both general dictionary and financial dictionary categories can significantly improve the accuracy of the prediction models. Bankruptcy prediction; Word categorization; Sentiment analysis; Machine learning; Meta-learning