第七周周报

第七周周报

这次的天池贷款违约预测比赛,是我第一次参加数据挖掘这方面相关的比赛,经过七周的时间,从学习数据挖掘相关知识,数据预处理,建模到特征工程,参数优化,我从中学习到了数据挖掘领域的许多知识。

数据预处理

在本次的比赛中,我感受到了数据处理的重要之处,通过恰当地处理数据,能够大幅地提升预测的水平,我从这次比赛中,也学习到了很多数据处理的方式。
在数据处理之前,我们首先需要了解数据本身的特点,需要观察,数据的缺失情况,数据的一致性,是否存在矛盾的数据,数据中的数值型与非数值型数据,数据的分布情况,通过对数据的了解,我们才能恰当地处理数据。
分析完数据之后,我们需要对数据进行处理,我在本次比赛中,将非数值型数据,转化为了数值型,对缺失值进行填充,对只有单一值的列,进行删除,并且,通过对原数据中多种属性的概括总结,形成了新的特征,通过数据的处理,能够提升模型的准确性。

建模

我采用的是lightgbm模型,这个模型训练效率高的同时,还能提高准确性,通过对原数据集进行划分,划分为训练集与测试集,进行训练,在模型的相关参数的优化方面,我采用了贝叶斯调参的方法,对参数进行优化,对于最后的结果,也起到了很大的提升作用。

总结

本次比赛是我第一次参加的数据挖掘比赛,从零开始掌握了数据挖掘中的很多知识,在接下来的比赛中,我计划尝试更多的模型,扩宽知识面。

成绩

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值