Datacastle 微额贷款人品预测大赛总结

感谢datacastle和现金巴士提供了这样好的大数据竞赛平台!


主要从以下几个方面总结:

(0)数据预处理:

  缺失值:删除缺失值大于194的样例

 根据缺失值个数分段构造离散特征

 数值型变量:log变换

(1)特征工程

          (1)排序特征:将数值型数据排序,将其rank作为新的特征

          (2)连续特征离散化:等量,或者等间距

          (3)计数特征:每个样本离散特征1-10的数量,生成10个新特征

     (4)类别特征:one-hot-encoding

(2)特征选择

  (1)MIC

  (2)皮尔逊相关系数

  &

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值