- 博客(5)
- 收藏
- 关注
原创 2020-09-18
第二部分数据分析 在这一部分主要做一下数据分析,主要是为了理解数据,对数据集含义有一定的理解,进而为建模打下一定基础。 首先是对数据整体的理解,包括一些基本的python 函数的使用: data.info(),data.describe(), data.shape, data.dtypes, data.columns, data.head()等函数,对数据有一个基本的概念上的认知 关注数据质量的问题,包括理解数据的缺失,异常值等情况 关注不同数据的数据类型的问题: 将数据拆分为数值型和类型
2020-09-18 23:16:22 82
原创 零基础入门金融风控
零基础入门金融风控@lingchendake 了解金融风控及评分体系 金融风控的作用 决定是否放贷 决定放贷金额的大小 熟悉解题思路 数据准备 熟悉数据集,确定响应变量 数据处理: 变量筛选(向前,向后,逐步回归) 多重共线性:VIF, 主成分 数据清洗: 异常值(盖帽法) 缺失值(聚类,回归,均值填补,直接删除) 类平衡 过采样 欠采样 特征选择 正负样本惩罚权重 模型开发 模型评估 ROC KS 建立评分卡 优比 评分控制在一定范围 ...
2020-09-15 23:04:47 406
原创 相关分析
一般做相关分析的思路: 使用散点图观测,球形表达了完全无关的关系 协方差,只能描述一般趋势,无法直观描述变化程度。大于0 ,正相关,小于0,负相关,等于0,无关 相关系数,经过标准化的Y和X的协方差,去量纲 相关系数与协方差 相关系数可以看成是一种提出了两个变量梁刚影响、标准化后的特殊协方差。 各相关系数的关系 皮尔逊,一般用来计算两个连续型变量的相关系数 肯德尔,一个连续一个分类变量(最...
2019-10-13 15:59:17 861
原创 Leeds所学整理
leeds 所学整理@Song Yabiao 写作动机 航空公司工作两年后,来到英国读硕士,目前就读于利兹大学数学学院的Data Science and Analystics. 一年很快就要过去了,现在只剩毕业论文,同时也要开始找工作了。自由的时间有很多,但是自己并没有充分的利用起来,为了更好的应对将要到来的找工作,在写论文的同时整理一下这一年的所学,复习一下。 课程设置 Semester one...
2019-06-16 18:41:09 134
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人