一、Supervised learning (监督学习)
1、regression problem(回归问题)
监督学习是指,我们给算法一个数据集,其中包括正确答案(你想要的正确结果)。比如给定房价数据集,对于里面每个房子的占地面积,我们都给出对应的正确房价(即该房子卖出的价格),算法的目的就是给出更多的正确答案。这里的回归问题是:我们想要预测连续的数值输出,也就是价格。
在这里,我们称 房子面积为特征值(feature),房子价格为标签(label)。我们根据特征值(房子面积)来预测标签(房价)。
如图,这是一个房价的数据集,我们使用算法对其进行进行拟合,可以是直线(一次函数,粉色),也可以是二次函数(蓝色),比如,使用一次函数预测,当我想卖掉750平方米的房子,那么卖的价格可以是150千美元。
虽然房价是一个离散值,但是我们认为房价是一个实数,、标量或者连续值。即有变量x,根据数据集,来推算出结果y的值。
2、classification problem分类问题
1、单特征值