Skip to main content

Login for students

Login for employees

Publication detail

Combining rough set-based relevance and redundancy for the ranking and selection of nominal features
Authors: Froelich Wojciech | Hájek Petr
Year: 2020
Type of publication: článek ve sborníku
Name of source: Procedia Computer Science : 24th KES International Conference on Knowledge-Based and Intelligent Information & Engineering Systems KES2020
Publisher name: Elsevier Science BV
Place: Amsterdam
Page from-to: 1459-1468
Titles:
Language Name Abstract Keywords
cze Kombinace relevance a redundance založené na roughových množinách pro seřažení a selekci nominálních atributů V tomto článku navrhujeme novou metodu pro seřazení a výběr atributů. Náš přístup je založen na řazení nominálních atributů z hlediska jejich relevance pro přiřazenou třídu a vzájemné redundance s ostatními atributy. Pro výpočet relevance a redundance navrhujeme použít přístup založený na roughových množinách. Po provedení seřazení se filtrování atributů provádí s učitelem, což uživateli umožňuje rozhodnout o počtu zachovaných atributů. Experimenty odhalily, že díky naší metodě je možné odfiltrovat řadu atributů popisujících data při zachování uspokojivé přesnosti klasifikace dosažené klasifikátorem naučených na redukované datové sadě. Srovnávací experimenty prováděné s využitím veřejně dostupných datových souborů prokázaly vysokou účinnost a konkurenceschopnost našeho přístupu.
eng Combining rough set-based relevance and redundancy for the ranking and selection of nominal features In this paper, we propose a new method for features ranking and selection. Our approach is based on ranking nominal features in terms of their relevance to the assigned class and mutual redundancy with the other features. To calculate the relevance and redundancy, we propose to use a rough-set based approach. After performing the ranking, features filtering is carried out in a supervised way enabling the user to decide on the number of the retained features. The experiments revealed that thanks to our method, it is possible to filter out numerous features describing data while still maintaining satisfactory classification accuracy achieved by the classifier trained using the reduced dataset. The comparative experiments performed with the use of publicly available datasets proved the high efficiency and competitiveness of our approach. feature ranking; feature selection; rough sets