自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 2020-09-18

第二部分数据分析 在这一部分主要做一下数据分析,主要是为了理解数据,对数据集含义有一定的理解,进而为建模打下一定基础。 首先是对数据整体的理解,包括一些基本的python 函数的使用: data.info(),data.describe(), data.shape, data.dtypes, data.columns, data.head()等函数,对数据有一个基本的概念上的认知 关注数据质量的问题,包括理解数据的缺失,异常值等情况 关注不同数据的数据类型的问题: 将数据拆分为数值型和类型

2020-09-18 23:16:22 82

原创 零基础入门金融风控

零基础入门金融风控@lingchendake 了解金融风控及评分体系 金融风控的作用 决定是否放贷 决定放贷金额的大小 熟悉解题思路 数据准备 熟悉数据集,确定响应变量 数据处理: 变量筛选(向前,向后,逐步回归) 多重共线性:VIF, 主成分 数据清洗: 异常值(盖帽法) 缺失值(聚类,回归,均值填补,直接删除) 类平衡 过采样 欠采样 特征选择 正负样本惩罚权重 模型开发 模型评估 ROC KS 建立评分卡 优比 评分控制在一定范围 ...

2020-09-15 23:04:47 406

原创 相关分析

一般做相关分析的思路: 使用散点图观测,球形表达了完全无关的关系 协方差,只能描述一般趋势,无法直观描述变化程度。大于0 ,正相关,小于0,负相关,等于0,无关 相关系数,经过标准化的Y和X的协方差,去量纲 相关系数与协方差 相关系数可以看成是一种提出了两个变量梁刚影响、标准化后的特殊协方差。 各相关系数的关系 皮尔逊,一般用来计算两个连续型变量的相关系数 肯德尔,一个连续一个分类变量(最...

2019-10-13 15:59:17 861

原创 复习知识点总结

今天使用思维导图整理了一下互联网金融及信用卡评分模型建立的相关知识和概念:下面是图片

2019-07-02 01:38:26 122

原创 Leeds所学整理

leeds 所学整理@Song Yabiao 写作动机 航空公司工作两年后,来到英国读硕士,目前就读于利兹大学数学学院的Data Science and Analystics. 一年很快就要过去了,现在只剩毕业论文,同时也要开始找工作了。自由的时间有很多,但是自己并没有充分的利用起来,为了更好的应对将要到来的找工作,在写论文的同时整理一下这一年的所学,复习一下。 课程设置 Semester one...

2019-06-16 18:41:09 134

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除