Datawhale 零基础入门数据挖掘二手车预测task04

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK4

使用语言:python

Tas1 – Task5

Task4建模调参

  • 目标:机器学习建模、调参

  • 操作内容: 线性回归 & 五折交叉验证 & 模拟真实业务情况

  • 交叉验证(Cross Validation)
    -通常在处理数据的时候会 一般分为:训练集(train_set),评估集(valid_set),测试集(test_set)这三个部分。当把所有的数据集都拿来训练,而是分出一部分来(这一部分不参加训练)对训练集生成的参数进行测试,相对客观的判断这些参数对训练集之外的数据的符合程度。这种思想就称为交叉验证

  • 结果图
    在这里插入图片描述

  • 模拟真实业务情况
    这是比较结合实际情况的一种操作方式:在本例中,我们选用靠前时间的4/5样本当作训练集,靠后时间的1/5当作验证集,最终结果与五折交叉验证差距不大;而在实际数据研究中需要再定义。

  • 绘制学习率曲线与验证曲线

  • 在这里插入图片描述

  • 重点:本节学习了嵌入式的方法

  • 嵌入式特征选择在学习器训练过程中自动地进行特征选择。嵌入式选择最常用的是L1正则化与L2正则化。在对线性回归模型加入两种正则化方法后,他们分别变成了岭回归与Lasso回归。

  • 比较结果如下:Lasso更好

  • 在这里插入图片描述

  • 此外,选择了部分常用模型与线性模型进行效果比对。(有点慢,下次更新)

  • 模型调参:贪心算法、网格调参、贝叶斯调参(下次更新)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值