学习理论-模型诊断与调参

myazi

于 2018-09-17 22:46:53 发布

阅读量303

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010865478/article/details/82750319

版权

机器学习专栏收录该内容

42 篇文章 5 订阅

订阅专栏

学习理论

1、基本概念

2、PAC理论

3、VC维

4、极大似然，最大后验概率，贝叶斯估计

5、模型评估与评价指标

6、模型诊断调参

六、模型诊断与调参

一、快速搭建

1、数据集准备

2、特征工程

3、模型选择

4、模型评价

在我们开发过程中，我们往往都是摸着石头过河，我们不知道数据应该是什么样子，不知道数据的特征，数据集多少合适，如何进行特征工程，选择什么样的模型最合适，最后我们采用什么指标来评价模型。对于一系列模糊的过程，我们很难确定各个模块该如何处理，如何优化，所以我们需要快速搭建一个模型，通过结果去分析如何优化问题。

二、偏差/方差分析

可以说，决定模型最后性能的就是偏差和方差，如果模型在测试集上很好，在训练集上不好，那么很有可能是模型方差过大（模型过拟合，前提是训练集和测试集分布大致一致）。如果模型在训练集上不好，那么意味着模型偏差过大（模型欠拟合）。针对这两种情况，采用控制变量法去调优模型。

一般而言，在模型调优的过程有如下选择：

1）更多的数据集

2）特征工程

3）模型参数调优

4）优化算法调优

5）换模型，换优化算法

6）数据集分析

如何定位出模型的问题，就需要分析模型在训练集和测试集上误差来大致确定是偏差问题还是方差问题。

偏差问题：

1）优化算法：是否收敛，学习率是否合适，迭代次数是否合适，是否需要换优化算法

2）模型：模型参数选择是否合适，模型的表示能力是否更强，是否需要换模型

3）特征工程：特征选择和特征提取是否做的不够

方差问题：

1）测试集和训练集分布是否一致

2）模型是否加强正则项，调优模型防止过拟合的参数

3）优化算法是否可以提前收敛

4）特征工程

5）增加训练数据集

其中最难是不同的模型有不同的调优方式，尤其是参数多的模型，一般采用控制变量的方法固定其他不变来调整其中一个来调优。对于不同的模型，还有特殊的处理技巧，比如深度学习，各种超参，技术都会影响性能。另外，特征工程是一个觉得模型性能上限的技术，要想得到一个很好的模型，后期大量时间花费在特征工程上。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
学习理论-模型诊断与调参

学习理论1、基本概念2、PAC理论3、VC维4、极大似然，最大后验概率，贝叶斯估计5、模型评估与评价指标6、模型诊断调参六、模型诊断与调参一、快速搭建 1、数据集准备 2、特征工程 3、模型选择 4、模型评价在我们开发过程中，我们往往都是摸着石头过河，我们不知道数据应该是什么样子，不知道数据的特征，数据集多少合适，如何进行特征工程，选择什么样的模型最合适，最后我们...
复制链接

扫一扫

专栏目录

myazi CSDN认证博客专家 CSDN认证企业博客

码龄11年

57: 原创

10万+: 周排名

60万+: 总排名

15万+: 访问

: 等级

2054: 积分

98: 粉丝

51: 获赞

25: 评论

342: 收藏

私信

关注

热门文章

分类专栏

最新评论

Linux内核源代码情景分析笔记
TIMANDDAY: 我不明白__pa(x)这个宏，他把虚拟地址转换成物理地址，但是，如果我的内存没有4G，比如只有1G，甚至是512mb，那这个宏算出来岂不是错了
动态规划乘法表问题
浙江省第一延迟: 已经想清楚了，谢谢铁子的帖子，太顶了
动态规划乘法表问题
浙江省第一延迟: if(i+k<len&&str[i+k]!='\0') j=i+k; else j=size; 这里的j为什么是=size啊，而不是size-1，我觉得=size-1才对，但测试发现是 =size是正确的
Linux内核源代码情景分析笔记
夜半读核: 这本书不太好读，特别是内存管理这一章，我草草读了一遍，正打算读第二遍呢！
NLP中文分词C++实现
weixin_45598354: 请问如何调试？小贝一枚求解答，谢谢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。