数据挖掘 周报二

理论学习:

1. 观看了学习资料的赛题理解baseline讲解
2. 根据论坛的资料一步步学习,知道如何实现一个较好的方案:数据分析->特征工程->建模调参->模型融合;目前学习到特征工程。

2.1 数据分析

  • 对数据集进行查看,对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模。
  • 了解变量间的相互关系、变量与预测值之间的存在关系。

2.2 特征工程

  • 使用特征预处理、缺失值、异常值处理、数据分桶等特征处理方法

2.3 建模调参

  • 使用多种在金融分控领域常用的机器学习模型,并进行调参

2.4 模型融合

  • 将之前建模调参的结果进行模型融合。 尝试多种融合方案

实践

根据baseline的讲解,重现了一遍;之后先据此在数据提取方面进行改进:(1)employmentTitle(就业职称),考虑删除;(2)regionCode(地区编码),根据城市大小进行变换;(3)earliesCreditLine(借款人最早报告的信用额度开立的月份 )考虑删除等。

下面是目前成绩:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值