监督学习(Supervised Learning)分两类
- 回归(Regression),连续的(直线或曲线)
- 分类(Classification),离散的(1或0)
回归:尝试预测连续值的输出。
根据房屋的建筑面积判断对应房子的出售价格
用离散的点拟合出直线或曲线。
拟合(fitting):根据离散点对应得到大致能代表这些数据的曲线
分类:预测一个离散值的输出
根据肿瘤的大小判断,肿瘤
- 是恶性的对应纵坐标 1(Y)
- 不是恶性的对应纵坐标 0(N)
离散值也不一定只有1和0两个,也可以是0、1、2、3多个值的形式。
上图只用一种特征来判断肿瘤是否是恶性。然而还可以通过多种特征来判断肿瘤是否是恶性,如年龄+肿瘤大小
因此判断直线下方是良性的肿瘤,上方是恶性的肿瘤
练习题
判断问题1(Problem 1)和问题2(Problem 2)对应监督学习的哪种分类。
答案:
监督学习和无监督学习(Unsupervised Learning)
在无监督学习中,我们不知道这些数据能有什么用,只知道有这么一些数据集。然后根据这些没有定义的数据集找出其中的结构。
以上图为例,我们可以把所给的数据集分成两个不同的簇(cluster)。
这样分簇的过程使用的算法就叫他聚类算法(cluster algorithm)
练习题
答案: