AlphaGo是如何战胜人类的?这些机器学习知识不能不懂

机器学习是人工智能领域的热门研究话题。不论是在围棋上击败人类的AlphaGo,还是人脸识别系统,机器学习在诸多领域都取得了令人瞩目的成就。总的来说,机器学习让就是计算机具有像人一样的学习和思考能力的技术。具体方法就是从已知数据中获得规律,并利用规律对未知数据进行预测或理解。本文将以通俗易懂的方式解释机器学习中的术语,旨在为广大同学打下基础、培养兴趣,为以后的深入学习做准备。
数据
数据是机器学习的必要因素。是通过观察、实验或计算得出的结果。
模型
模型就是机器学习所要得到的目标,可以看做是从数据中提炼出的知识。
维度
指描述一个数据所需的参数个数。例如描述一个平面直角坐标系中的点需要两个数(x,y),则该点的维度为2。
标量
只有大小没有方向的量,如时间
矢量
既有大小又有方向的量,如速度
矩阵
是一个按照长方阵列排列的数集合,也可看做有两个方向的矢量。我们将一个棋盘看做一个矩阵。棋盘的每个点对应矩阵的位置,该点有黑子则值为1,有白字则值为-1,无子则值为0。

张量
张量是有大小和多个方向的量。是矢量和矩阵的扩展。我们可以将标量视为零阶张量,矢量视为一阶张量,那么矩阵就是二阶张量。
特征
特征是关于数据的描述。机器学习其实就是从数据的特征中学习。棋盘的特征就是黑子和白子的位置。
标签
标签是对一条数据的评判,多是人为给出的。标签与特征不同,数据可以没有标签。对于一条棋盘数据,它的标签可以是当前白字获胜的概率。
训练
而从数据集中学出模型的过程,便称为学习或训练。
训练集
用于训练过程得到模型的数据集
验证集
是模型训练过程中单独留出的数据集,它可以用于对模型的能力进行初步评估,决定何时停止训练。
测试集
用来评估模最终模型的泛化能力。
泛化能力
指模型对于训练时没见过的新鲜数据样本的适应能力。如果我们要使机器学会判定一个棋局的胜负,若模型能准确对训练集中的数据做出正确判断,而不能对训练集之外的数据做出正确判断,则可以说该模型的泛化能力较差。
误差
模型的预测输出与数据样本真实输出之间的差异,用来评价模型对训练数据的适应程度。
机器学习分为监督学习、非监督学习和强化学习
监督学习
在学习过程中,提供对错指示。需要使用有标签的数据学习。就像我们在下棋时,有一位老师在身边指导。他会告诉我们每一步棋的好坏以及当前棋局哪一方会获胜的概率大。通过棋盘信息和老师给出的标签,机器就能学会判断局势,进而取得胜利。

分类
分类是监督学习的重要应用,即找一个模型判断输入数据所属的类别。判断棋局的胜负就是一种分类任务。
二分类
二分类是最简单的分类任务,分类结果只有两种,非黑即白。
回归
分类问题的输出是离散型数据,例如0和1。而回归的目标变量为连续型,例如0到1之间的所有实数。回归就是对连续型变量做出预测。

无监督学习
在学习过程中,不提供对错指示。即使用无标签的数据学习,也就是没有老师的指导。只是把一堆棋局摆在机器面前,是很难让它学会下棋的。但是可以学会分辨哪些棋局具有类似的特征。
聚类
俗话说:“物以类聚,人以群分”,所谓聚类,顾名思义,就是指把相似的元素聚在一类。聚黑和分类很像,只是聚类属于无监督学习,我们不能对类别有准确的定义。
降维
我们也可以使用无监督学习处理数据,把维度较高、计算复杂的数据,转化为维度低、易处理、且蕴含的信息不丢失或较少丢失的数据,这便是降维。

强化学习
强化学习是以“试错”的方式进行学习,使用的数据通过与环境进行交互获得,没有标签但是有奖励信号,强化学习的目标是使智能体获得最大奖励。机器通过与其他人对弈来学会下棋,而不是像监督学习那样通过棋谱学习。奖励信号就是每局的输赢,输得到-1,嬴得到+1。机器会学会选择那些能带来胜利的行为。
马尔科夫过程
一种将来的状态仅和当前状态有关而和过去的状态无关的状态转移过程。我们把棋盘看做状态。对弈过程就是一个马尔科夫过程,当前时刻的棋局的信息就可以决定未来的棋局。强化学习就是建立在马尔科夫过程上的。

深度学习
理论上来说,参数越多的模型越能完成更复杂的学习任务。深度学习就是通过拥有较多参数的网络结构模型来学习。典型的深度学习模型就是多层的神经网络

神经网络
神经网络已是一个相当大的交叉学科领域。各相关学科对于神经网络的定义多种多样。神经网络是由具有适应性的基本单元组成的广泛并行互联的网络。最基本的单元是神经元模型。

神经元模型
在生物学中,神经元是神经系统最基本的结构和功能单位。神经元之间有连接,当它激活时,就会向相连的神经元发送化学物质,从而改变这些神经元内的点位。机器学习中的神经元模型正是模拟了这一过程。

如上图所示,左边的四个神经元是输入层,它们的输入就是我们的数据,若数据将其激活,则向中间的神经元发送信息(化学物质)。中间层称为隐含层,接收输入层发来的信信息,若将其激活,则向右边的输出层发送信息。输出层输出的信息就是模型的预测结果。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值