Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK4
使用语言:python
Tas1 – Task5
Task4建模调参
-
目标:机器学习建模、调参
-
操作内容: 线性回归 & 五折交叉验证 & 模拟真实业务情况
-
交叉验证(Cross Validation)
-通常在处理数据的时候会 一般分为:训练集(train_set),评估集(valid_set),测试集(test_set)这三个部分。当把所有的数据集都拿来训练,而是分出一部分来(这一部分不参加训练)对训练集生成的参数进行测试,相对客观的判断这些参数对训练集之外的数据的符合程度。这种思想就称为交叉验证 -
结果图
-
模拟真实业务情况
这是比较结合实际情况的一种操作方式:在本例中,我们选用靠前时间的4/5样本当作训练集,靠后时间的1/5当作验证集,最终结果与五折交叉验证差距不大;而在实际数据研究中需要再定义。 -
绘制学习率曲线与验证曲线
-
重点:本节学习了嵌入式的方法
-
嵌入式特征选择在学习器训练过程中自动地进行特征选择。嵌入式选择最常用的是L1正则化与L2正则化。在对线性回归模型加入两种正则化方法后,他们分别变成了岭回归与Lasso回归。
-
比较结果如下:Lasso更好
-
此外,选择了部分常用模型与线性模型进行效果比对。(有点慢,下次更新)
-
模型调参:贪心算法、网格调参、贝叶斯调参(下次更新)