在本科期间没有掌握好相应的基础知识,对于机器学习一直保持在一个抽象的概念中,老师课堂上讲授的知识点都未能及时吸收、消化、掌握。开博客写文章的初衷是希望通过对知识点的学习、整理能够及时跟上老师的进度。虽然不奢求能够学的有多牛叉,但是还是希望在和别人探讨相关知识的时候能够说出点道道,而不是....一问三不知。上课都跟梦游似的。接下来,主要从基本概念出发逐步深入。
1、机器学习的定义
通过机器学习的算法研究与具体问题相结合,获得适合的模型。对于工程中的一些应用比较依赖于数学和历史经验。通过对现存数据的学习或者观察获得新的推理过程。
具体实现方法有:回归分析、SVM、NN、概率方法、聚类方法...以后会对这些部分做详细分析...
2、机器学习的一般步骤
我们希望计算机能具备和我们人类一样的学习能力,针对特定的学习任务进行分类、预测。它的主要过程如下:
3、数据样本
机器学习的输入是将一系列的样本分类、回归、关联或者聚类。每个样本都具有一系列的特性。多个样本及其特性构成一个矩阵或者一张表,构成了基本输入单元。
1)数据特征化
2)数据标准化
观察数据分布:集中趋势,差别和分布。计算数据统计特性:median, max,min, outliers, variance等.
4、机器学习的应用
在《机器学习》的第一章中就以实际的学习任务开始研究机器学习。书中主要采用了获胜的百分比作为衡量标准开始设计一个学习下西洋跳棋的程序。而机器学习的作用并不限于此。目前计算机已经能够成功的识别人类的讲话、学习驾驶车辆、学习分类新的天文结构等等。
后记
这是写的第一篇文章,难免有许多不足的地方,欢迎批评指正,如果您能给个意见、留个言再好不过了
参考资料:
1、中文版:《机器学习》,Tom Mitchell,曾华军 等(译),机械工业出版社,2003年.
2、机器学习PPT课件