训练数据、验证数据、测试数据
建模之前,我们可以把数据分成三部分。
训练集(Training data)验证集(Validation data)测试集(Test data)
训练集还是用来训练,构建模型。
验证集是用来在模型训练阶段测试模型的好坏。
等模型训练好之后,再用测试集来评估模型的好坏。
学习方式
1.监督学习
2.无监督学习:没有标签的数据
3.半监督学习 (使用较少)
半监督学习是监督学习和无监督学习相结合的一种学习方式。主要是用来解决使用少量带标签的数据和大量没有标签的数据进行训练和分类的问题。
常见应用
应用类别
1.回归
2.分类有标签数据
3.聚类无标签数据
4.回归
回归、分类、聚类
回归:预测数据为连续型数值。
分类:预测数据为类别型数据,并且类别已知。
聚类∶预测数据为类别型数据,但是类别未知。