机器学习系列—ch1
主要内容:
机器学习的定义
监督学习 Supervised Learning
无监督学习 Unsupervised Learning
一、机器学习的定义
机器学习的定义
二、监督学习 Supervised Learning
利用监督学习预测波士顿房价(回归问题)
-
大多数情况下,可能会拟合直线
-
有时候用二次曲线去拟合效果可能会更好
预测波士顿房价
什么是回归问题?
在监督学习中,我们给学习算法一个数据集,比如一系列房子的数据,给定数据集中每个样本的正确价格,即它们实际的售价然后运用学习算法,算出更多的答案,我们需要估算一个连续值的结果,这属于回归问题.
利用监督学习来推测乳腺癌良性与否(分类问题)
-
横轴表示肿瘤的大小
-
纵轴表示1表示恶性,0表示良性
利用监督学习来推测乳腺癌
什么是分类问题?
机器学习的问题就在于,估算出肿瘤是恶性的或是良性的概率,属于分类问题。
分类问题指的是,我们试着推测出离散的输出值:0或1良性或恶性,而事实上在分类问题中,输出可能不止两个值。
比如说可能有三种乳腺癌,所以希望预测离散输出0、1、2、3。0 代表良性,1 表示第1类乳腺癌,2表示第2类癌症,3表示第3类,也是分类问题。
应用
-
垃圾邮件问题
-
疾病分类问题
三、无监督学习 Unsupervised Learning
-
监督学习中,数据是有标签的
-
无监督学习中,数据是没有标签,主要提到了聚类算法
监督学习和无监督学习
应用
-
基因学的理解应用
-
社交网络分析
-
组织大型计算机集群
-
细分市场
-
新闻事件分类
目录