一、什么是机器学习
机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。
所以,机器学习不是某种具体的算法,而是很多算法的统称。
机器学习包含了很多种不同的算法,深度学习就是其中之一,其他方法包括决策树,聚类,贝叶斯等。深度学习的灵感来自大脑的结构和功能,即许多神经元的互连。人工神经网络(ANN)是模拟大脑生物结构的算法。不管是机器学习还是深度学习,都属于人工智能(AI)的范畴。所以人工智能、机器学习、深度学习可以用下面的图来表示:
机器学习的基本思路:
- 把现实生活中的问题抽象成数学模型,并且很清楚模型中不同参数的作用
- 利用数学方法对这个数学模型进行求解,从而解决现实生活中的问题
- 评估这个数学模型,是否真正的解决了现实生活中的问题,解决的如何?
可形象表示为下图
二、机器学习的原理
以监督学习为例
当我们刚开始识字时,老师会在黑板上写上:一,二,三,我们从黑板上看到这三个字,耳朵反反复复的听到老师说这是yi,这是er,这是san,当这些看到的和听到的反反复复进行时,经过大脑运行,就是学习的过程,然后我们就认识了这三个字。
- 上面提到的黑板上的字在机器学习中叫——训练集
- 上面提到的“一条线,两条线”这种区分不同汉字的属性叫——特征
- 不断学习的过程叫——建模
- 学会了识字后总结出来的规律叫——模型
通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫“机器学习”!
三、监督学习、非监督学习、强化学习
1.监督学习
监督学习是指我们给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法。
例如:
我们准备了一大堆帽子和鞋子的照片,我们想让机器学会如何识别鞋子和帽子。当我们使用监督学习的时候,我们需要给这些照片打上标签。
我们给照片打的标签就是“正确答案”,机器通过大量学习,根据特征信息,就可以学会在新照片中认出鞋子和帽子。
2.非监督学习
非监督学习中,给定的数据集没有“正确答案”,所有的数据都是一样的。无监督学习的任务是从给定的数据集中,挖掘出潜在的结构。
我们把一堆鞋子和帽子的照片给机器,不给这些照片打任何标签,但是我们希望机器能够将这些照片分分类。
通过学习,机器会把这些照片分为2类,一类都是帽子的照片,一类都是鞋子的照片。虽然跟上面的监督学习看上去结果差不多,但是有着本质的差别:
非监督学习中,虽然照片分为了帽子和鞋子,但是机器并不知道哪个是帽子,哪个是鞋子。对于机器来说,相当于分成了 A、B 两类。
3.强化学习
强化学习更接近生物学习的本质,因此有望获得更高的智能。它关注的是智能体如何在环境中采取一系列行为,从而获得最大的累积回报。通过强化学习,一个智能体应该知道在什么状态下应该采取什么行为。
四、总结
从大型数据集中发现模式和相关性,然后根据数据分析结果作出最佳决策和预测。