(《机器学习》完整版系列)1-1 机器也学习?

机器也学习?

“机器学习”很火,一天有人问我:“机器也学习?”。如下作一简单的解释并作为周志化《机器学习》辅导系列的开篇。
————————————————————————————————

平时,我们所说的“学习”一词是指人类的学习,“好好学习,天天向上”,打开这个博客看看,你就在学习。

但“机器学习”(machine learning)是怎么回事?

首先,人们希望机器越来越智能,能像人类一样“学习”,这是人类给予未来的一个美好愿望与期待,因此,将这方面的研究冠之以“机器学习”就是再自然不过的事了。

其次,目前“机器学习”还是初级的,与其说是“学习”还不如说是“训练”,即训练机器去完成某项特定的预测任务。 例如,【西瓜书】中,“判断西瓜的好坏”就是一个特定的预测任务。 用于“学习”的机器也不是通常的机器,而是在机器(计算机)上装有一种特殊的软件,叫“算法”,为区别于其他类型的算法,常称它为“学习算法”(learning algorithm),“学习算法”里的“学习”不是动词,而是动名词,是对算法的类型加以限定。

再次,人类学习有个重要方法,叫“总结经验”。 类似,“机器学习”主要是从“经验”中学习。 然而,机器中并没有对“经验”的具体地描述,而“经验”体现为一堆“数据”,称为数据集,因此,“机器学习”就是通过“数据”来训练出一个模型,之后就用这个模型去解决指定的问题(即特定任务)。 例如,以判断西瓜好坏为目的,我们去观察并切开若干个西瓜,纪录这些西瓜的“数据”,再用这些“数据”去“训练”一个“机器”(含有“学习算法”的计算机),训练出一个“模型”,之后,反复用这个“模型”去来判断西瓜的好坏。

因此,可以这样简单地理解“机器学习”这个词:针对一个预测任务,寻找一个合适的“机器”(即算法),将“数据”(即训练集)输入该“机器”训练出一个模型(确定参数,类比成“学习”),最后将这个模型作为产品投放到应用场景中(用于预测任务)。 这个过程流水线分为三大步,对应于“机器学习”涉及的三类角色:一是“算法工程师”,他以研究“算法”为主业,发明新算法、优化旧算法;二是“数据工程师”,他既要从现实中获取“数据”,又要从算法工程师提供的“算法库”中选取合适的算法,有机地结合二者训练出模型,这些工作常需借助机器学习平台来完成;三是用户,他使用数据工程师训练出的模型(产品)去完成预测任务。

综上,“机器学习”与人类学习有天壤之别,英文中用的词为“learn”而不是“study”,也体现了这一点。 “机器学习”已成为一门学科的专有名词,其主要方向是研究“学习算法”及其如何有效地训练,当然,与之相关的内容也在研究之列,如,获取怎样的“数据”、怎样评价结果等等。

机器学习主要应用于人类“可见”的三大领域(图像识别、语音识别和自然语言处理)以及人类“不可见”的其他“识别”领域(如,数据挖掘)1,并由此派生出许许多多的二级应用场景,如,人脸识别、自动翻译、聊天机器人、业务风险识别、智能推荐、智能医疗、自动驾驶等等。

我已经写了一个系列博客,以周志华的西瓜书为背景材料,为同鞋们提供辅导。
恭喜你进入了这个辅导系列!现在你可以吃着西瓜,开始学习《机器学习》了。
书山有路勤为径,预祝你走向成功。

本文为原创,您可以:

  • 点赞(支持博主)
  • 收藏(待以后看)
  • 转发(他考研或学习,正需要)
  • 评论(或讨论)
  • 引用(支持原创)
  • 不侵权

上一篇:无
下一篇:1-2 简化现实世界


  1. 实际上,机器学习应用都是些“模糊”领域,在“精确”领域里它不擅长,例如,给小学生判数学作业的产品,其内部由两大部分组成:一是将手写的数字及算式认出来,二是判断这些数学运算的结果对不对,机器学习仅用于解决“认出来”。 ↩︎

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值