Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Combining weighted SMOTE with ensemble learning for the class-imbalanced prediction of small business credit risk
Autoři: Abedin Mohammad Zoynul | Guotai Chi | Hájek Petr | Zhang Tong
Rok: 2023
Druh publikace: článek v odborném periodiku
Název zdroje: Complex & Intelligent Systems
Název nakladatele: Springer
Místo vydání: Heidelberg
Strana od-do: 3559-3579
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Kombinace váženého SMOTE se skupinovým učením pro třídně nevyváženou predikci úvěrového rizika malých podniků Při hodnocení úvěrového rizika malých podniků jsou třídy úvěrů v selhání a bez selhání značně nevyvážené. K překonání tohoto problému tato studie navrhuje rozšířený přístup založený na technice váženého syntetického menšinového převzorkování (WSMOTE), který se nazývá WSMOTE-ensemble. Navržený ansámblový klasifikátor hybridizuje WSMOTE a Bagging se vzorkováním kompozitních směsí, aby byla zaručena robustnost a variabilita generovaných syntetických instancí, a tím minimalizována malá omezení třídního zkreslení podniků spojená s instancemi v selhání a bez selhání. Původní soubor údajů o malých podnicích použitý v této studii byl převzat z 3111 záznamů z čínské komerční banky. Realizací důkladné experimentální studie rozsáhle zkreslených scénářů modelování dat bylo vytvořeno víceúrovňové experimentální prostředí pro doménu vzácných událostí. Na základě vhodných hodnotících měřítek tato studie navrhuje, že klasifikátor náhodného lesa použitý v modelu WSMOTE-ensemble poskytuje dobrý kompromis mezi výkonem na třídě selhání a třídě neselhání. Ansámblové řešení zlepšilo přesnost menšinové třídy o 15,16 % ve srovnání s konkurenčními modely. Tato studie také ukazuje, že metody s výběrem vzorků překonávají algoritmy bez výběru vzorků. Díky těmto příspěvkům tato studie vyplňuje pozoruhodnou mezeru ve znalostech a přidává několik jedinečných poznatků týkajících se predikce úvěrového rizika malých podniků. Malé podniky; úvěrové riziko; nevyvážená data; převzorkování; vážený SMOTE; učení souboru
eng Combining weighted SMOTE with ensemble learning for the class-imbalanced prediction of small business credit risk In small business credit risk assessment, the default and nondefault classes are highly imbalanced. To overcome this problem, this study proposes an extended ensemble approach rooted in the weighted synthetic minority oversampling technique (WSMOTE), which is called WSMOTE-ensemble. The proposed ensemble classifier hybridizes WSMOTE and Bagging with sampling composite mixtures to guarantee the robustness and variability of the generated synthetic instances and, thus, minimize the small business class-skewed constraints linked to default and nondefault instances. The original small business dataset used in this study was taken from 3111 records from a Chinese commercial bank. By implementing a thorough experimental study of extensively skewed data-modeling scenarios, a multilevel experimental setting was established for a rare event domain. Based on the proper evaluation measures, this study proposes that the random forest classifier used in the WSMOTE-ensemble model provides a good trade-off between the performance on default class and that of nondefault class. The ensemble solution improved the accuracy of the minority class by 15.16% in comparison with its competitors. This study also shows that sampling methods outperform nonsampling algorithms. With these contributions, this study fills a noteworthy knowledge gap and adds several unique insights regarding the prediction of small business credit risk. Small business; Credit risk; Imbalanced data; Oversampling; Weighted SMOTE; Ensemble learning