- 任务描述:本教程对LendingClub平台贷款数据进行分析并搭建用户画像,学习后可帮助学员在银行,消费金融,现金贷等场景中,实现金融场景下用户画像系统的搭建、多层级标签体系的设计。其中主要由画像体系介绍、python数据清洗、标签设计、画像输出和画像评测组成。
- 数据集:本数据集来源于kaggle,是2016Q2年到2018Q2年LendingClub实际发放的贷款的信息,总共有145个Column,共计98,2735行数据。LendingClub是世界上最大的P2P互联网借贷平台。它的主要业务为根据借款人过往信用记录等信息,评估借款人的违约风险,设置不同的借款利率,借款人可以通过提交申请,快速获得借款;投资人通过浏览借款人的过往信用记录和借款目的等信息,决定是否借款给不同借款利率的借款人,赚取利息收益。
- 数据集:通过DSSM算法进行商品推荐.zip-机器学习文档类资源-CSDN下载
- 运行环境:Python3.7环境下测试了本教程代码。需要的第三方模块和版本包括:
pandas 1.1.2 numpy 1.18.4 matplotlib 3.0.3 sklearn 0.21.0 xgboost 0.82 seaborn 0.9.0 scipy