通过分析这几个集的误差大小可以大致判断误差来源,其中针对偏差和方差的处理方法已经在我之前的博客里面有说明了。所以主要讲解数据不匹配问题。
总而言之,遇到数据不匹配问题,做误差分析,对比训练集和开发集,试图找出这两个数据分布到底有什么不同,然后考虑是否有办法收集更多与开发集相似的数据做训练。
![判断不哦那个误差来源的例子](https://i-blog.csdnimg.cn/blog_migrate/843cb3b342ed03043a83587abc2b2f73.jpeg)
![解决数据不匹配的方法](https://i-blog.csdnimg.cn/blog_migrate/dc9e0483c908fcb7b18e3c5cde64b330.jpeg)
通过分析这几个集的误差大小可以大致判断误差来源,其中针对偏差和方差的处理方法已经在我之前的博客里面有说明了。所以主要讲解数据不匹配问题。
总而言之,遇到数据不匹配问题,做误差分析,对比训练集和开发集,试图找出这两个数据分布到底有什么不同,然后考虑是否有办法收集更多与开发集相似的数据做训练。