对监督学习的理解

最新推荐文章于 2021-08-29 19:20:40 发布

weixin_33696106

最新推荐文章于 2021-08-29 19:20:40 发布

阅读量185

点赞数

文章标签： python 人工智能

原文链接：https://my.oschina.net/u/587323/blog/1596840

版权

2019独角兽企业重金招聘Python工程师标准>>>

机器学习分为监督学习，非监督学习，强化学习和深度学习。

监督学习，是从标记的训练数据来推断一个功能的机器学习任务。

比如，在家里教宝宝认识苹果和梨，你拿出四个苹果和四个梨，放桌子上教宝宝认识这些水果。这些苹果和梨就是已经标注好的数据。

然后指着苹果对宝宝说：“来，宝宝，往这看，这是苹果，来跟我念，苹——果——。”

“苹——果——。”

“好。”

然后又指着香蕉对宝宝说：“来，看这里，这是梨，来给我念，梨——。”

“梨——。”

依次把这些水果都教宝宝认一遍。这就是监督学习的训练过程，训练完成后还要做一下测试，看看宝宝是否都学习会了。

监督学习中，一般把数据分成两部分，一部分是学习数据，占总数据集的80%以上，一部分是测数据，占总数据集的20%一下。测试时，你从冰箱里拿出一个苹果和一个梨，问宝宝：“宝宝，这是什么呀？”。这就是监督学习的测试过程。

在测试中，宝宝把苹果认错了，你分析发现，原来你教宝宝的时候用的是红苹果，测试时，用的是青苹果。这说明你对数据划分的不合理，训练数据中应该包括红苹果和青苹果。

为了避免这个问题，在训练时，先把数据随机打乱，再把数据分成训练数据和测试数据。

其实在真正的监督学习中，学习过程类型与上面说的类似，只是在学习时，使用了一些算法，数据量级也是上百万，上千万，甚至上亿的。

为了训练出更好的机器学习模型，我们会先选择一个合适的机器学习算法，再为这个算法准备好不同的参数。

在训练时，我们把学习算法和参数结合起来，组合成一个模型。为选出一个最好的模型，我们会使用一些交叉验证法，计算出一个得分，哪个模型得分高就选哪个模型。

交叉验证法有很多种，我们一般使用K折交叉验证。K折交叉验证是把训练数据分成K份，然后依次拿出一份做为验证数据，其剩下他的K-1份数据做为训练数据，用来训练机器学习模型，训练完成后，再拿验证数据，测试模型得分。这样循环执行K次，然后再把每次验证得分加一起算平均值，作为模型的得分，得分最高的模型，就是我们选取的模型。

然后再用测试数据测试我们选取的模型，看看它的正确率怎么样。

有时我们在训练时，得分很高，但是在测试时，正确率却很低。我们把这种现象叫过拟合。过拟合出现的原因是训练条件太苛刻了。比如，你在教宝宝认苹果的时候，拿出一个红苹果，对宝宝说：“宝宝，这是苹果，它的颜色的红的，上面还有个把。” 然后你再拿出来一个红色没把的苹果，他就不认识了。因为你教他的时候，条件太苛刻了，红色带把的苹果叫苹果。这就叫过拟合。

出现过拟合，那么我们就需要，调整参数，再重新训练。找到最好的模型，然后测试。直到测试的正确率满意为止。

转载于:https://my.oschina.net/u/587323/blog/1596840

weixin_33696106

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
对监督学习的理解

2019独角兽企业重金招聘Python工程师标准>>> ...
复制链接

扫一扫

weixin_33696106 CSDN认证博客专家 CSDN认证企业博客

码龄9年

153: 原创

-: 周排名

187万+: 总排名

133万+: 访问

: 等级

7747: 积分

7295: 粉丝

257: 获赞

19: 评论

1448: 收藏

私信

关注

热门文章

最新评论

我是如何分析CNKI上所有关于“齿轮”文章的？（一）CNKI爬虫记
许桉: 作者你好，打扰啦，我是一个初学爬虫的学生，在学习爬虫知网摘要，在github找到了renqingyu这位博主的文章，但是实操起来发现url有问题，获取失败，想问问博主是怎么解决的，多有打扰，感谢！
Android读写properties配置文件
smithlzh: 打印堆栈找不到文件路径: 12460-12460/com.example.socket.AWPackingApp W/System.err: java.io.FileNotFoundException: /data/user/0/com.example.socket.AWPackingApp/files/appConfig (No such file or directory) 问题出在 public class ProperTies { private static String configPath = "appConfig";
Android读写properties配置文件
smithlzh: 我也是遇到同样的问题你们解决了吗?
Android读写properties配置文件
smithlzh: 请教 weixin_33696106 如何解决: tools.customToast(result, LoginActivity.this); cannot resolve symbol 'tools' ?
Nginx (一)Windows下编译Nginx源码以及安装 nginx for windows方法步骤
睿思达DBA_WGX: 慢慢学习，感谢分享。

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。