金融风控-贷款违约预测-训练营 - Task 2

金融风控-贷款违约预测-训练营 - Task 2

项目地址
比赛地址

一、 学习知识点概要

  1. 学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值)
  2. 数据特征相关的可视化

二、学习内容

2.1 学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值)

2.1.1 准备工作
  • 导入所需的库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import datetime
import warnings
warnings.filterwarnings('ignore')
  • 读取数据文件
data_train = pd.read_csv('train.csv')
data_test_a = pd.read_csv('testA.csv')
2.1.2 对数据的初步了解

大致包括包括数据集大小,原始特征维度,数据类型,数据集中各特征基本统计量

  • 数据集大小,原始特征维度(通过shape,columns函数查看)
  • 数据类型(使用info()
data_train.info
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
【资源介绍】 基于python实现的银行个贷违约预测源码+项目说明+数据集.zip 该项目是个人毕设项目,答辩评审分达到95分,代码都经过调试测试,确保可以运行!欢迎下载使用,可用于小白学习、进阶。 该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。 项目整体具有较高的学习借鉴价值!基础能力强的可以在此基础上修改调整,以实现不同的功能。 欢迎下载交流,互相学习,共同进步! 背景 ``` 为进一步促进金融普惠的推广落地,金融机构需要服务许多新的客群。 银行作为对风险控制要求很高的行业,因为缺乏对新客群的了解, 对新的细分客群的风控处理往往成为金融普惠的重要阻碍。如何利用银行现有 信贷行为数据来服务新场景、新客群成了一个很有价值的研究方向, 迁移学习是其中一个重要手段。 ``` 任务描述 ``` 本赛题要求利用已有的与目标客群稍有差异的另一批信贷数据, 辅助目标业务风控模型的创建,两者数据集之间存在大量相同的字段和极少的共同用户。 此处希望大家可以利用迁移学习捕捉不同业务中用户基本信息与违约行为之间的关联, 帮助实现对新业务的用户违约预测。 ``` 数据描述 - 训练数据 - train_public.csv:个人贷款违约记录数据 测试数据 - test_public.csv:测试数据集 评价指标 使用ROC曲线下面积AUC(Area Under Curve)作为评价指标。AUC值越大,预测越准确。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值