数据挖掘小白系列!机器学习中调参的基本思想

最新推荐文章于 2021-03-24 18:16:00 发布

一天天的就知道学习

最新推荐文章于 2021-03-24 18:16:00 发布

阅读量222

点赞数

分类专栏：数据挖掘自存笔记文章标签：机器学习 python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35679701/article/details/106525684

版权

笔记同时被 3 个专栏收录

18 篇文章 0 订阅

订阅专栏

17 篇文章 0 订阅

订阅专栏

13 篇文章 2 订阅

订阅专栏

本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正

1大家都不说调参的原因

=============================

其一是因为，调参的方式总是根据数据的状况而定，所
以没有办法一概而论；其二是因为，其实大家也都没有特别好的办法。

2常规调参路线

=============================

画学习曲线，或者网格搜索，我们能够探索到调参边缘（代价可能是训练一次模型要跑三天三夜）

3高手的调参思想

=============================

1）非常正确的调参思路和方法
2）对模型评估指标的理解
3）对数据的感觉和经验
4）用洪荒之力去不断地尝试。

1）非常正确的调参思路和方法

=============================

第一步是要找准目标：我们要做什么？
一般来说，这个目标是提升某个模型评估指标，找准了这个目标，我们就需要思考：模型在未知数据上的指标受什么因素影响？
对模型效果来说:分类->准确率,回归->MSE; 对模型整体来说:泛化性+效果
而衡量模型在未知数据上的准确率的指标叫做泛化误差
总结:一般调的就是泛化误差,让模型在泛化误差最低点
PS:小数据可以直接做这个图出来,大数据就要根据对模型的理解,判断在图形的哪里.比如随机森林树模型容易过拟合,那一般就是在最低点的右边.需要在保持准确率的同时把复杂度降下来
泛化误差图
泛化误差详见:https://www.cnblogs.com/juanjiang/p/10774616.html

2)对模型评估指标的理解

=============================

这个是太重要的了,打比赛的都知道.在不同需求下,挑选正确能让模型实际效果提升一大截,这个要自己慢慢学习,没得办法
常见各种损失函数1

常见各种损失函数2

3）对数据的感觉和经验

=============================

个人觉得就是对数据集/业务的了解程度.典型的例子就是信用卡用户.1个失信用户99个守约用户,那直接蒙全是守约用户那模型的准确率都有99%,然后这明显会让我们血亏,这是都对数据集调整或者模型权重调整就很重要了.

4）用洪荒之力去不断地尝试。

=============================

买个顶级配置,让电表转起来!

4个人对调参的一点想法

=============================

调参实际情况是很复杂.
从手段上来说:AUTOML+传统
从数据上来说:如果是分类的我可能会百分比抽出来,在小数据跑个大概的范围出来.大数据上应用

一天天的就知道学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘小白系列!机器学习中调参的基本思想

本文章只用于学习交流不用于任何商业行为,所有知识点资料来源于网络,如有任何不当之处请私信联系,作者会及时改正本文中总结自文档所有标注的页码都是附件参考文档中的页码由于markdown不支持附件下载,附件链接如下http://note.youdao.com/noteshare?id=c0fdd78d4a7d79165f4406402caca6301大家都不说调参的原因=============================其一是因为，调参的方式总是根据数据的状况而定，所以没有办法一概而论；其二
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。