机器学习是目前最激动人心的技术之一。我们每天都会多次用到学习算法,每次当我们使用Google或Bing等搜索引擎时,它能给出如此满意的结果,原因之一就是Google或微软使用的学习算法学会了如何给网页排序。
机器学习定义
Arthur Samuel给出的定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域。
Tom Mitchell给出的定义:计算机程序从经验E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
机器学习算法
监督学习(Supervised learning):人教会计算机做某些事情
无监督学习(Unsupervised learning):让计算机自己学习
其他:强化学习(Reinforcement learning),推荐系统(recommender systems)
监督学习
1.房价预测
横坐标表示房的大小,纵坐标表示房价。这个问题属于监督问题,每个样本都给出了准确的答案。 同时这也是一个回归问题,对给定值预测实际输出。
2.肿瘤预测
横坐标表示肿瘤大小,纵坐标表示是否是恶性肿瘤。这也是属于监督学习问题,同时这也是一个分类问题,设法预测离散值的输出,恶性还是良性?
- 小结
监督学习的定义:给算法一个数据集,其中包含了每个样本都有正确的答案,在房价预测这个数据集中,每个样本都给出了正确的价格,即房子的卖价。更专业的定义,被称为回归问题,指的是想要预测连续的数值输出;回归:设法预测连续值的属性。肿瘤预测是一个分类问题,分类:设法预测离散值的输出。监督算法的目的是为了给出更多的正确答案。
无监督学习
对于监督学习中的每一个样本我们已经被清楚的告知了什么是所谓的正确答案。
在无监督学习中我们所用的数据没有任何标签,都具有相同的标签或者都没有标签。
可以把这些数据分成两个不同的簇,这也叫作聚类算法。运行一个聚类算法,把不同的个体归入不同的类或归为不同类型的人,这就是无监督学习。聚类算法是无监督学习的一种。
无监督学习或聚类算法的应用:组织大量的计算机集群;社交网络的分析;市场细分中的应用;天文数据的分析。
参考原文:https://blog.csdn.net/qq_34611579/article/details/80665546