申请评分卡中的数据预处理和特征衍生(下)
在上一遍申请评分卡中的数据预处理和特征衍生(上),我们主要讲解了
- 构建信用风险类型的特征
- 特征分箱
- WOE编码
也就是对应图中(数据预处理、特征构造)
这篇文章我们主要讲解特征选择,要学习特征选择,就要学习以下的知识点
- 特征信息度的计算和意义
- 信用风险中的单变量分析和多变量分析
特征信息度的计算和意义
在申请评分卡这一块,主要以应用特征信息度为主
IV(information value)衡量的是某一个变量的信息量,公式如下:
在上一遍申请评分卡中的数据预处理和特征衍生(上),我们主要讲解了
也就是对应图中(数据预处理、特征构造)
这篇文章我们主要讲解特征选择,要学习特征选择,就要学习以下的知识点
在申请评分卡这一块,主要以应用特征信息度为主
IV(information value)衡量的是某一个变量的信息量,公式如下: