返回首页>>

贷款状态分类预测





案例整理者:
方博文
最后修订:
2020-12-15

任务类型:分类预测

算法:Logistic Regression;决策树;KNN;SVM

数据源:贷款状态数据集(60K)

下载地址1(train.csv )(test.csv ) 下载地址2(北大网盘


      背景:是否提供贷款,是银行业长久以来的命题。贷款是否能按时收回对银行业绩表现是否良好有直接影响。本案例正产生于银行业的这种需求。该案例类似于机器学习中的二分类问题,以贷款状态(是否提供贷款)为目标类别,通过过往客户的多方面信息,预测是否应该为新客户提供贷款。案例来源于Kaggle[ https://www.kaggle.com/yaheaal/loan-status-with-different-models]竞赛,利用Python进行数据分析与挖掘。
      数据集:文案例所使用数据由Kaggle提供,分为train/test两个数据集,分别用以训练、测试。训练数据数据集共有614行(样本),13列,其中最后一列是贷款状态(Loan Status),也即分类任务的目标。

案例分析文档:bank.docx(2.1M)

案例分析展示:bank.pptx(4.6M)

案例分析源代码:bank.ipynb(675K)