本文是《机器学习宝典》第 1 篇,读完本文你能够掌握机器学习的基本常识!
什么是机器学习
对于没有经验的同学来说,直接给出一个关于机器学习的定义太不友好了,所以我们通过换个方式来说明到底什么是机器学习(machine learning)。
当你看到路上有一堆密密麻麻的蚂蚁在搬家,心想快要下雨了,我得早点回家;当你在街道上看到一个眼睛蓝色、头发金色、鼻梁高挺的人,心想这肯定又是一个白种人老外。
我们看到蚂蚁搬家,知道要下雨是因为我们之前经历过很多次蚂蚁搬家,然后下雨的情况;我们看到眼睛蓝色、头发金色、鼻梁高挺的人认定是白种人是因为大多数长这样的人都是白种人。也就是说利用我们之前学习到的经验,我们能够对未来的一些新事务做出有效判断。
那么问题来了,既然利用人学习到的经验可以对新事物做出有效判断,那能不能让机器也学习一些经验,然后帮助我们去做一些事情呢?
机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。 在机器的眼中,“经验”基本上都是以“数据”的形式存在的,因此,机器学习要研究的就是一个学习算法,这个学习算法能够从数据中产生模型(model),而模型能够给我们提供相应的判断(例如,是否属于黄种人)。
常用术语
机器学习这门学科中包含了一些常用术语,我们来介绍一些常用的术语。想要进行机器学习,自然就离不开数据。所以我们先从数据说起。假定我们收集了关于是否属于黄种人的数据。
编号 | 眼睛 | 发色 | 发型 | 鼻梁 | 身高 | 黄种人 |
---|---|---|---|---|---|---|
1 | 棕色 | 黑色 | 直 | 中 | 170 | 属于 |
2 | 黑色 | 黄色 | 直 | 低 | 180 | 属于 |
3 | 灰色 | 金色 | 卷 | 高 | 180 | 不属于 |
4 | 蓝色 | 黄色 |