Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Two-stage consumer credit risk modelling using heterogeneous ensemble learning
Autoři: Papoušková Monika | Hájek Petr
Rok: 2019
Druh publikace: článek v odborném periodiku
Název zdroje: Decision Support Systems
Název nakladatele: Elsevier Science BV
Místo vydání: Amsterdam
Strana od-do: 33-45
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Dvoufázové modelování spotřebitelského úvěrového rizika pomocí heterogenního meta-učení Modelování spotřebitelského úvěrového rizika je klíčovým úkolem bank a nebankovních finančních institucí na podporu rozhodování o poskytování úvěrů. Pro modelování celkového úvěrového rizika spotřebitelského úvěru z hlediska očekávané ztráty (EL) je třeba odhadnout tři klíčové parametry úvěrového rizika: pravděpodobnost selhání (PD), ztráta při selhání (LGD) a expozice při selhání (EAD). Dosavadní výzkum měl tendenci tyto parametry modelovat samostatně. Zanedbanou oblastí v modelování LGD / EAD je navíc aplikace meta-učení, které využíváním rozmanitých algoritmů strojového učení snižuje problém přeučení a umožňuje modelování různých rizikových profilů nesplácených úvěrů. K překonání těchto problémů navrhujeme v tomto článku dvoustupňový model úvěrového rizika, který integruje (1) nevyvážené meta-učení pro predikci PD (kreditního hodnocení) a (2) predikci EAD pomocí souboru regresorů. Kromě toho se používá víceúčelová evoluční selekce atributů k minimalizaci nákladů na nesprávnou klasifikaci (RMSE) u modelů PD a EAD a počtu atributů nezbytných pro modelování. Pro tento úkol navrhujeme metriku pro chybnou klasifikaci nákladů, která je vhodná pro spotřebitelské úvěry s fixní expozicí, protože kombinuje náklady příležitosti a LGD. Ukazujeme, že navrhovaný model úvěrového rizika je nejen efektivnější než jednostupňové modely úvěrového rizika, ale také překonává nejmodernější metody používané k modelování úvěrového rizika z hlediska predikce a ekonomické výkonnosti. úvěrové riziko; meta-učení; úvěrové skórování; očekávaná ztráta; expozice při selhání
eng Two-stage consumer credit risk modelling using heterogeneous ensemble learning Modelling consumer credit risk is a crucial task for banks and non-bank financial institutions to support decision-making on granting loans. To model the overall credit risk of a consumer loan in terms of expected loss (EL), three key credit risk parameters must be estimated: probability of default (PD), loss given default (LGD) and exposure at default (EAD). Research to date has tended to model these parameters separately. Moreover, a neglected area in the field of LGD/EAD modelling is the application of ensemble learning, which by benefitting from diverse base learners reduces the over-fitting problem and enables modelling diverse risk profiles of defaulted loans. To overcome these problems, this paper proposes a two-stage credit risk model that integrates (1) class-imbalanced ensemble learning for predicting PD (credit scoring), and (2) an EAD prediction using a regression ensemble. Furthermore, multi-objective evolutionary feature selection is used to minimize both the misclassification cost (root mean squared error) of the PD and EAD models and the number of attributes necessary for modelling. For this task, we propose a misclassification cost metric suitable for consumer loans with fixed exposure because it combines opportunity cost and LGD. We show that the proposed credit risk model is not only more effective than single-stage credit risk models but also outperforms state-of-the-art methods used to model credit risk in terms of prediction and economic performance. Credit risk; Ensemble learning; Credit scoring; Expected loss; Exposure at default