![db88ce0effb335a1cac02c0976ca442e.png](https://i-blog.csdnimg.cn/blog_migrate/bffeca69b550a874ecefff7caeaee8ed.jpeg)
数据在人工智能技术里是非常重要的!本篇文章将详细给大家介绍3种数据集:训练集、验证集、测试集。
同时还会介绍如何更合理的讲数据划分为3种数据集。最后给大家介绍一种充分利用有限数据的方式:交叉验证法。
先用一个不恰当的比喻来说明3种数据集之间的关系:
- 训练集相当于上课学知识
- 验证集相当于课后的的练习题,用来纠正和强化学到的知识
- 测试集相当于期末考试,用来最终评估学习效果
![c0f855853a13cb88cd8d97411f1eddbb.png](https://i-blog.csdnimg.cn/blog_migrate/673b18cbeab3f5ba2b72898d3539afa2.jpeg)
什么是训练集?
训练集(Training Dataset)是用来训练模型使用的。
在《一文看懂机器学习》里我们介绍了机器学习的7个步骤,训练集(Training Dataset)主要在训练阶段使用。