Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Modelling loss given default in peer-to-peer lending using random forests
Autoři: Papoušková Monika | Hájek Petr
Rok: 2019
Druh publikace: článek ve sborníku
Název zdroje: Intelligent Decision Technologies 2019 : Proceedings of the 11th KES International Conference on Intelligent Decision Technologies (KES-IDT 2019), Vol. 1
Název nakladatele: Springer Nature
Místo vydání: Heidelberg
Strana od-do: 133-141
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Modelování ztráty při defaultu v P2P úvěrování pomocí náhodných stromů Modelování úvěrového rizika v půjčování typu peer-to-peer (P2P) je stále důležitější díky rychlému růstu uživatelských základen platforem P2P. Pro podporu rozhodování o poskytování půjček P2P byly v modelech úvěrového rizika P2P použity různé metody strojového učení. Takové modely však byly omezeny na predikci úvěrového selhání, aniž by se bral v úvahu finanční dopad úvěrů. Ztráta při selhání (LGD) se používá k modelování spotřebitelského úvěrového rizika k řešení tohoto problému. Dřívější přístupy k modelování půjček na LGDin P2P inklinovaly k použití více lineárních regresních metod s cílem identifikovat determinanty úvěrového rizika půjček P2P. Zde ukazujeme, že tyto metody nejsou dostatečně účinné pro zpracování komplexních funkcí přítomných v datech půjčování P2P. Navrhujeme nový systém podpory rozhodování pro modelování LGD v půjčování P2P. Aby se snížil problém nadměrného vybavení, systém používá učení ve dvou náhodných lesích (RF). Nejprve jsou pomocí klasifikace RF identifikovány extrémně rizikové půjčky s LGD = 1. Za druhé, LGD zbývajících P2P půjček se předpovídá pomocí regresní RF. Lze tedy efektivně modelovat neobvyklé rozdělení hodnot LGD. Prokazujeme, že navrhovaný systém je účinný pro měřítko platformy P2P Lending Club, protože jiné metody, které se v současné době používají při modelování LGD, jsou překonány. úvěrové riziko; ztráta při defualtu; P2P úvěry; náhodné stromy
eng Modelling loss given default in peer-to-peer lending using random forests Modelling credit risk in peer-to-peer (P2P) lending is increasingly important due to the rapid growth of P2P platforms’ user bases. To support decision making on granting P2P loans, diverse machine learning methods have been used in P2P credit risk models. However, such models have been limited to loan default prediction, without considering the financial impact of the loans. Loss given default (LGD) is used in modelling consumer credit risk to address this issue. Earlier approaches to modelling LGD in P2P lending tended to use multivariate linear regression methods in order to identify the determinants of P2P loans’ credit risk. Here, we show that these methods are not effective enough to process complex features present in P2P lending data. We propose a novel decision support system to LGD modeling in P2P lending. To reduce the problem of overfitting, the system uses random forest (RF) learning in two stages. First, extremely risky loans with LGD = 1 are identified using classification RF. Second, the LGD of the remaining P2P loans is predicted using regression RF. Thus, the non-normal distribution of the LGD values can be effectively modelled. We demonstrate that the proposed system is effective for the benchmark of P2P Lending Club platform as other methods currently used in LGD modelling are outperformed. Credit risk; Loss given default; Peer-to-peer lending; Random forests