Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Concurrent Sentiment and Concept Extraction from Corporate Annual Reports for Financial Performance Forecasting
Autoři: Hájek Petr | Olej Vladimír
Rok: 2015
Druh publikace: článek ve sborníku
Název zdroje: 6th International Multi-Conference on Complexity, Informatics and Cybernetics, IMCIC 2015: Proceedings Vol. II
Název nakladatele: International Institute of Informatics and Systemics
Místo vydání: Winter Garden
Strana od-do: 57-62
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Současná extrakce sentimentu a konceptu z výročních zpráv pro predikci finanční výkonnosti Cílem článku je extrahovat sentiment a koncepty z korpusu dokumentů. Extrahujeme lineární kombinace atributů, abychom zkoumali vztahy mezi kategoriemi sentimentu a koncepty získanými rozkladem singulárních hodnot. Ukazujeme, že tyto atributy jsou spojené s finanční výkonností. Získanou znalost využíváme k porovnání algoritmů rozhodovacích stromů (Best First rozhodovací strom, Alternating rozhodovací strom), podpůrných vektorových strojů (SVM) a neuronových sítí. Cílem je zkoumat výkonnost klasifikace dokumentů na množině výročních zpráv. Ukazujeme, že (1) SVM dosahuje nejvyšší přesnosti na predikci investičních / neinvestičních tříd a (2) finančně slabé podniky častěji používají určité slovní kategorie jako běžná slova, slova vztažená k osobám, negativní slova a zdůrazňují současnou obchodní situaci, aniž by se zabývaly problémy spojenými s ekonomickým poklesem. výroční zprávy; extrakce konceptu; sentiment; Best First rozhodovací strom; Alternating rozhodovací strom; podpůrné vektorové stroje; vícevrstvá perceptronová neuronová síť
eng Concurrent Sentiment and Concept Extraction from Corporate Annual Reports for Financial Performance Forecasting This paper aims to extract both sentiment and concept knowledge from a corpus. We extract linear combinations of features to examine the relations between sentiment categories and concepts obtained using singular value decomposition. We show that the features are related to current financial performance indicators. We use the extracted knowledge to compare decision trees algorithms (Best First Decision Tree, Alternating Decision Tree) on the one hand and Support Vector Machines and Multilayer Perceptron type Neural Networks on the other hand. The aim is to investigate the performance of document classification for a set of annual reports. We show that (1) Support Vector Machines provide the best accuracy in forecasting investment / non-investment grades, and (2) poorly performing companies frequently use commonality, human interest and negative terms and emphasize current business situation, without actively addressing problems associated with economic downturn. Annual Reports; Concept Extraction; Sentiment; Best First Decision Tree; Alternating Decision Tree; Support Vector Machines; Multilayer Perceptron Neural Networks