最近开始准备为研究生方向做准备了,同时因为学校这边项目的原因需要学习机器学习相关的算法,所以在coursera上开始学习机器学习相关内容。
Tom Mitchell给了一个机器学习的定义:
"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."
比如对于下象棋而言:E=多次下棋的经验,T=下棋这件事,P=程序胜利的几率。
机器学习分为:监督学习与无监督学习。
监督学习:
在监督学习中,我们会给出一个数据集,该数据集里的输入和输出都有一定的联系,且输出将会有一个正确的值。
监督学习被分类为:回归、分类问题。
回归问题:预测一个连续的输出。例如:预测第二天的气温。
分类问题:预测一个离散的输出。例如:预测明天的我是否会比今天更重。
回归和分类的区别是,在回归的例子中,预测25.5度和25.6度差不多,但是分类问题中,答案只有 是/否。
无监督学习:
无监督学习允许我们不清楚数据的结果是什么样的,我们是取得数据的结构或者数据间的关系。
例如:在1,000,000个基因中,将那些相似度高的基因进行分类。