Publikace detail

Concurrent Sentiment and Concept Extraction from Corporate Annual Reports for Financial Performance Forecasting

Autoři: Hájek Petr | Olej Vladimír

Rok: 2015

Druh publikace: článek ve sborníku

Název zdroje: 6th International Multi-Conference on Complexity, Informatics and Cybernetics, IMCIC 2015: Proceedings Vol. II

Název nakladatele: International Institute of Informatics and Systemics

Místo vydání: Winter Garden

Strana od-do: 57-62

Tituly:

Jazyk	Název	Abstrakt	Klíčová slova
cze	Současná extrakce sentimentu a konceptu z výročních zpráv pro predikci finanční výkonnosti	Cílem článku je extrahovat sentiment a koncepty z korpusu dokumentů. Extrahujeme lineární kombinace atributů, abychom zkoumali vztahy mezi kategoriemi sentimentu a koncepty získanými rozkladem singulárních hodnot. Ukazujeme, že tyto atributy jsou spojené s finanční výkonností. Získanou znalost využíváme k porovnání algoritmů rozhodovacích stromů (Best First rozhodovací strom, Alternating rozhodovací strom), podpůrných vektorových strojů (SVM) a neuronových sítí. Cílem je zkoumat výkonnost klasifikace dokumentů na množině výročních zpráv. Ukazujeme, že (1) SVM dosahuje nejvyšší přesnosti na predikci investičních / neinvestičních tříd a (2) finančně slabé podniky častěji používají určité slovní kategorie jako běžná slova, slova vztažená k osobám, negativní slova a zdůrazňují současnou obchodní situaci, aniž by se zabývaly problémy spojenými s ekonomickým poklesem.	výroční zprávy; extrakce konceptu; sentiment; Best First rozhodovací strom; Alternating rozhodovací strom; podpůrné vektorové stroje; vícevrstvá perceptronová neuronová síť
eng	Concurrent Sentiment and Concept Extraction from Corporate Annual Reports for Financial Performance Forecasting	This paper aims to extract both sentiment and concept knowledge from a corpus. We extract linear combinations of features to examine the relations between sentiment categories and concepts obtained using singular value decomposition. We show that the features are related to current financial performance indicators. We use the extracted knowledge to compare decision trees algorithms (Best First Decision Tree, Alternating Decision Tree) on the one hand and Support Vector Machines and Multilayer Perceptron type Neural Networks on the other hand. The aim is to investigate the performance of document classification for a set of annual reports. We show that (1) Support Vector Machines provide the best accuracy in forecasting investment / non-investment grades, and (2) poorly performing companies frequently use commonality, human interest and negative terms and emphasize current business situation, without actively addressing problems associated with economic downturn.	Annual Reports; Concept Extraction; Sentiment; Best First Decision Tree; Alternating Decision Tree; Support Vector Machines; Multilayer Perceptron Neural Networks

Vyhledávání

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Ústavy

Pracoviště

Jak nás najdete?

Služby

Často hledáte