如何让机器学习的模型表现的更好

最新推荐文章于 2020-07-23 12:44:04 发布

UESTC_C2_403

最新推荐文章于 2020-07-23 12:44:04 发布

阅读量934

点赞数

分类专栏：机器学习--ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/UESTC_C2_403/article/details/72899665

版权

机器学习--ML 专栏收录该内容

36 篇文章 6 订阅

订阅专栏

1. 对训练数据不做过多解释，模型简单比较好，模型简单对数据的解释就比较简单，解释的会更好。用简单的模型解释资料可以解释的话，可以说明数据的规律，如果模型复杂，就不知道数据的规律。所以做机器学习的时候先从简单的模型开始做起。

模型简单：参数比较少或者模型假设比较少，这两者其实是有关系的。

2. 抽样偏差（sampling bias）。也就是你的训练数据来自的分布与实际的分布不相符合，就是你的训练数据和测试数据分布不同，这样得到的模型效果就会有问题。训练数据有问题，那么采用验证方式对模型进行验证，可能两者都会比较小，因为他们两者相同的分布，所以这样得到的模型会有问题。

所以你要采用的方式就是在训练数据的时候和测试数据保持一样的环境。比如你分出的验证集可以不用随机性，按照需求来设定。

3. 偷看资料（visual data snooping）：偷看资料会造成我们人为干扰模型的建立，会对模型造成污染。利用了测试数据的信息，哪怕只是直接或者间接利用一点点，也会造成问题。慎重的处理偷看资料的问题。这个问题很难避免，如果完全不看，有时候也得不到好的结果。

小心的重复使用交叉验证。做决定之前尽量不看资料。选择一个模型。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何让机器学习的模型表现的更好

1. 对训练数据不做过多解释，模型简单比较好，模型简单对数据的解释就比较简单，解释的会更好。用简单的模型解释资料可以解释的话，可以说明数据的规律，如果模型复杂，就不知道数据的规律。所以做机器学习的时候先从简单的模型开始做起。模型简单：参数比较少或者模型假设比较少，这两者其实是有关系的。2. 抽样偏差（sampling bias）。也就是你的训练数据来自的分布与实际的分布不相符合，就
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。