机器学习笔记

一、什么是机器学习

机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。

所以,机器学习不是某种具体的算法,而是很多算法的统称。

机器学习包含了很多种不同的算法,深度学习就是其中之一,其他方法包括决策树,聚类,贝叶斯等。深度学习的灵感来自大脑的结构和功能,即许多神经元的互连。人工神经网络(ANN)是模拟大脑生物结构的算法。不管是机器学习还是深度学习,都属于人工智能(AI)的范畴。所以人工智能、机器学习、深度学习可以用下面的图来表示:

机器学习的基本思路:

  1. 把现实生活中的问题抽象成数学模型,并且很清楚模型中不同参数的作用
  2. 利用数学方法对这个数学模型进行求解,从而解决现实生活中的问题
  3. 评估这个数学模型,是否真正的解决了现实生活中的问题,解决的如何?

可形象表示为下图 

二、机器学习的原理

以监督学习为例

当我们刚开始识字时,老师会在黑板上写上:一,二,三,我们从黑板上看到这三个字,耳朵反反复复的听到老师说这是yi,这是er,这是san,当这些看到的和听到的反反复复进行时,经过大脑运行,就是学习的过程,然后我们就认识了这三个字。

  • 上面提到的黑板上的字在机器学习中叫——训练集
  • 上面提到的“一条线,两条线”这种区分不同汉字的属性叫——特征
  • 不断学习的过程叫——建模
  • 学会了识字后总结出来的规律叫——模型

通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫“机器学习”!

三、监督学习、非监督学习、强化学习

1.监督学习

监督学习是指我们给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法。

例如:

我们准备了一大堆帽子和鞋子的照片,我们想让机器学会如何识别鞋子和帽子。当我们使用监督学习的时候,我们需要给这些照片打上标签。

我们给照片打的标签就是“正确答案”,机器通过大量学习,根据特征信息,就可以学会在新照片中认出鞋子和帽子。

2.非监督学习

非监督学习中,给定的数据集没有“正确答案”,所有的数据都是一样的。无监督学习的任务是从给定的数据集中,挖掘出潜在的结构。

我们把一堆鞋子和帽子的照片给机器,不给这些照片打任何标签,但是我们希望机器能够将这些照片分分类。

通过学习,机器会把这些照片分为2类,一类都是帽子的照片,一类都是鞋子的照片。虽然跟上面的监督学习看上去结果差不多,但是有着本质的差别:

非监督学习中,虽然照片分为了帽子和鞋子,但是机器并不知道哪个是帽子,哪个是鞋子。对于机器来说,相当于分成了 A、B 两类。

3.强化学习

强化学习更接近生物学习的本质,因此有望获得更高的智能。它关注的是智能体如何在环境中采取一系列行为,从而获得最大的累积回报。通过强化学习,一个智能体应该知道在什么状态下应该采取什么行为。

四、总结

从大型数据集中发现模式和相关性,然后根据数据分析结果作出最佳决策和预测。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值