Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Combining rough set-based relevance and redundancy for the ranking and selection of nominal features
Autoři: Froelich Wojciech | Hájek Petr
Rok: 2020
Druh publikace: článek ve sborníku
Název zdroje: Procedia Computer Science : 24th KES International Conference on Knowledge-Based and Intelligent Information & Engineering Systems KES2020
Název nakladatele: Elsevier Science BV
Místo vydání: Amsterdam
Strana od-do: 1459-1468
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Kombinace relevance a redundance založené na roughových množinách pro seřažení a selekci nominálních atributů V tomto článku navrhujeme novou metodu pro seřazení a výběr atributů. Náš přístup je založen na řazení nominálních atributů z hlediska jejich relevance pro přiřazenou třídu a vzájemné redundance s ostatními atributy. Pro výpočet relevance a redundance navrhujeme použít přístup založený na roughových množinách. Po provedení seřazení se filtrování atributů provádí s učitelem, což uživateli umožňuje rozhodnout o počtu zachovaných atributů. Experimenty odhalily, že díky naší metodě je možné odfiltrovat řadu atributů popisujících data při zachování uspokojivé přesnosti klasifikace dosažené klasifikátorem naučených na redukované datové sadě. Srovnávací experimenty prováděné s využitím veřejně dostupných datových souborů prokázaly vysokou účinnost a konkurenceschopnost našeho přístupu.
eng Combining rough set-based relevance and redundancy for the ranking and selection of nominal features In this paper, we propose a new method for features ranking and selection. Our approach is based on ranking nominal features in terms of their relevance to the assigned class and mutual redundancy with the other features. To calculate the relevance and redundancy, we propose to use a rough-set based approach. After performing the ranking, features filtering is carried out in a supervised way enabling the user to decide on the number of the retained features. The experiments revealed that thanks to our method, it is possible to filter out numerous features describing data while still maintaining satisfactory classification accuracy achieved by the classifier trained using the reduced dataset. The comparative experiments performed with the use of publicly available datasets proved the high efficiency and competitiveness of our approach. feature ranking; feature selection; rough sets