机器是如何学习的?机器学习原理

随着人工智能技术的发展,机器学习已成为软件 / 互联网行业的常用技能,并开始向更多行业渗透。对越来越多的 IT 技术人员及数据分析从业者而言,机器学习正在成为必备技能之一。那么机器是如何学习的?机器学习原理是什么?今天我们就来聊聊机器学习的“入门级”问题。

机器是如何学习的?

对于人类而言,一个概念对应的是具体的事物,我们认知的事物都不是孤立的,互相之间有着各种各样的关联。比如我们对一个人说“苹果”的时候,他可能会想乔布斯创立的公司;也有可能想到圆圆的、香甜的、有皮有核的水果;也有可能想到香蕉、菠萝等其他水果。但是如果我继续说:“苹果一定要生吃,蒸熟了再吃就不脆了。”那么“苹果”一词确定无疑指的是水果,而不是公司。因为在我们的知识库里,都知道水果可以吃,但是公司不能吃。出现在同一句话中的“吃”对“苹果”起到了限定作用,这是人类的理解。

如果我们将“苹果”这两个字输入计算机,计算机并不会幻视出一个水果,也不会像人那样“意识到”这个单词的含义。计算机程序能够处理的只有数值和运算。

计算机程序不过是一段存储在硬盘上的 0、1 代码,运行时被读取进内存,CPU 根据代码转换成的指令来做一组特定的操作,让这些 0、1 数字通过逻辑电路进行若干运算后,生成计算结果。所以要让一段程序了解客观世界变化万千的事物,则必须将这些事物转化为数值,将事物的变化和不同事物之间的关联转化为运算。当若干现实世界的事物转换为数值后,计算机通过在这些数值之上的一系列运算来确定它们之间的关系,再根据一个全集之中个体之间的相互关系来确定某个个体在整体(全集)中的位置。

“苹果”被输入进去的时候,被转化为一个数值 Va。经过计算,这个数值和对应“吃”的数值 Ve 产生了某种直接的关联,而同时和 Ve 产生关联的还有若干数值,它们对应的概念可能是“香蕉”(Vb)、“菠萝”(Vp)、“猕猴桃”(Vc)等。据此,计算机就会发现 Va、Vb、Vp、Vc 之间的某些关联(怎么利用这些关联,就要看具体的处理需求了)。

说到数值,大家可能本能地想到 int、double、float……但实际上,如果将一个语言要素对应成一个标量的话,太容易出现两个原本相差甚远的概念经过简单运算后相等的情况了。假设“苹果”被转化为 2,而“香蕉”被转化为 4,难道说两个苹果等于一个香蕉吗?因此,一般在处理时会将自然语言转化成 n 维向量。只要转化方式合理,规避向量之间因为简单运算而引起歧义的情况还是比较容易的。

这种现实世界和计算机之间从概念到数值,从关系到运算的映射,造就了机器可以通过自主学习获得事物规律的可能。既然机器有可能自己学习事物的规律,那么如何才能让它学到规律呢?我们先来看一个故事。

猫妈妈让小猫去捉老鼠,小猫问:“老鼠是什么样子啊?”

猫妈妈说:“老鼠长着胡须。”结果小猫找来一头大蒜。

猫妈妈又说:“老鼠有 4 条腿。”结果小猫找来一个板凳。

猫妈妈再说:“老鼠有一条尾巴。”结果小猫找来一个萝卜。

在这个故事里,小猫就是一个基于规则的(rule-based)“计算机程序”,它完全按照“开发者”猫妈妈的指令行事。但是因为 3 次指令都不够全面,结果 3 次都得出了错误的结果。如果要把小猫变成一个基于机器学习模型的(model-based)计算机程序,猫妈妈该怎么做呢?

猫妈妈应该这样做,给小猫看一些照片,并告诉它有些是老鼠,有些不是。

猫妈妈可以先告诉小猫:要注意老鼠的耳朵、鼻子和尾巴。小猫通过对比发现:老鼠的耳朵是圆的,别的动物耳朵不是圆形的;老鼠都有长而细的尾巴,别的动物有的尾巴短,有的尾巴粗;老鼠的鼻子是尖的,别的动物不一定是这样的。这时小猫就学习到一个规律——老鼠是圆耳朵、细长尾巴、尖鼻子的动物,通过这个规律来抓老鼠,那么小猫就成了一个“老鼠分类器”。

小猫(此处将其类比为一个计算机程序)是机器(machine),让它成为“老鼠分类器”的过程叫作学习(learning)。猫妈妈给小猫看的那些照片是用于学习的数据(data)。猫妈妈告知小猫要注意的几点,是这个分类器的特征(feature)。学习的结果“老鼠分类器”是一个模型(model)。小猫思考的过程就是算法(algorithm)。

免费分享一些我整理的人工智能学习资料给大家,包括一些AI常用框架实战视频、图像识别、OpenCV、机器学习、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文、行业报告等。

为了更好的系统学习AI,推荐大家收藏一份。

下面是部分截图,文末附免费下载方式。

一、人工智能课程及项目【含课件源码】

二、国内外知名精华资源

三、人工智能论文合集

四、人工智能行业报告

学好人工智能,要多看书,多动手,多实践,要想提高自己的水平,一定要学会沉下心来慢慢的系统学习,最终才能有所收获。

点击下方名片,扫码关注公众号【AI技术星球】发送暗号 321 免费领取文中资料。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值