背景
曾经,在图片识别领域,关于机器学习在训练和测试的时候会出现准确率不是很高的问题,我问过一位大学教授,以下我们的对话:
我:我们搞机器学习时遇到训练和测试的准确率不是很高,是什么原因?
教授:我们的模型有些地方没学习到,样本量太少了。
我:那多少个样本才合适呢?
教授:问题不是样本量有多少,而是让模型把每一个地方都学到,这样识别率才会提上去。
常见的两个现象
我相信做过机器学习的人都应该遇到两个现象
一、刚开始的时候,我们模型的准确率不会是很高,可以通过一些办法可以做进一步的改进。
为了提升准确率会做以下几方面的工作:
1.调整参数
2.增加样本量
3.拓宽模型节点数,或者加深网络层数
4.尝试新的模型
4种办法是我们常用的,具体要增加多少个节点、多少层网络才合适呢?都是一步一步去尝试,比较才知道要定多少是合适的。
二、训练的时候准确率很高,而到了测试的时候准确率就很低,为什么?
网上搜了一下这个问题的答案,解析都是模型过拟合,解决办法是重新打乱训练数据和测试数据,或者增加样本量,或其他一些办法。
放大招
至于第二点中给出的解决办法,大家都公认是正确的,我也觉得没问题,但是,但是,我觉得解析还不够透彻,我是这么理解的