机器学习实战(1)—— 机器学习基础
老板:小韩啊,来来来!工程是不是写够了啊?
我:(what!!!)emmmm,还行还行。
老板:一看你就是写够了。最近公司要搞机器学习,你带头来学习一下吧!
我:行啊,工程代码我早就不想写了。那就学习一下吧!
老板:好,那就先去看《机器学习》吧!
自己现在是一名大四的学生,准备读研,当然没有工作,老板也是我捏造的。
荒废了大四好久的时间,最近,自己总算是慢慢提起学习的兴趣,开始学习机器学习了。以前从来没有接触过机器学习,所以在学习的初期,自己也向学长学姐请教了一下,于是决定从《机器学习实战》这本书开始入门机器学习。
为什么选择这本书,其实,总体来看,这本书比较基础,适合入门。对于一些数学定理,也就是拿过来用,并不注重这些定理的高深的推导过程。这对我一个数学渣渣来说,正好可以接受。
作为一名标准的理工男,我也算是第一次写文章,可能会有语病问题。有些东西可能写的不好,说的不明白,还望大家见谅。
好了,开篇的废话我也不多说了,直接进入“机器学习”的世界!
1.1 何谓机器学习
除却一些无关紧要的情况,我们很难直接从原始数据本身获得所需信息。
例如,对于垃圾邮件的检测,侦测一个单词是否存在并没有太大的作用,然而当某几个特定单词同时出现时,再辅 以考察邮件长度及其他因素,我们就可以更准确地判定该邮件是否为垃圾邮件。
简单地说,机器学习就是把无序的数据转换成有用的信息,让机器向我们的大脑一样去学习去判断。
其实,书中还有更多的信息去介绍机器学习的背景,因为大部分都是理论套话,这里我就不给大家列出了,有兴趣的可以直接去看《机器学习实战》这本书。
我们接下来直接看一下与机器学习有关的术语。
1.2 关键术语
在踏入任何一个领域之前,我们都有必要去了解该领域所读应的术语,机器学习也不例外。
好了,老板来了。
老板:小韩啊,看的怎么样了?机器学习里面的一些术语明白了吗??
我:明白了!明白了!So Easy!
老板:hhhh,好。那你给我系统的介绍一下吧。
我:好嘞!(求升职加薪脸)
下面,我们就从一个鸟类分类系统来介绍机器学习中的相关术语。
这类系统非常有趣,通常与机器学习中的专家系统有关。开发出能够识别鸟类的计算机软件,鸟类学者就可以退休了。因为鸟类学者是研究鸟类的专家,因此我们所以说创建的是一个专家系统。
下表是我们用于区分不同鸟类需要使用的四个不同的属性值,我们选用体重、翼展、有无脚蹼以及后背颜色作为评测基准。现实中,你可能会想测量更多的值。通常的做法是测量所有可测属性,而后再挑选出重要部分。下面测量的这四种值称之为特征,也可以称作属性,我们接下来一律将其称为特征。表中的每一行都是一个具有相关特征的实例。
体重(克) | 翼展(厘米) | 脚蹼 | 后背颜色 | <
---|