金融风控2 数据清洗 首先,对于数据要进行普通的数据清洗,包括缺失值的查看, 这里面包括22个特征存在数据缺失,所以需要对这里面的数据进行小小的处理, 分析具体有哪些缺失,并占缺失的%数位。如果缺少太多需要去掉,或者是进行填充,我这里采用的是多位数进行填充。 通常很多的特征包括数值特征和类别特征,其实这里面科研通过数据类型1查看,所以我们先把数据特征给分出来。 这里面是区别特征类别的code,很好用,推荐。 实际上,不同类型的数值特征,存在连续与离散的,需要进行鉴别 这个是区别分类的方法, 接下来就是对数据进行分析,并进行数据报告生成