怎样教一台计算机区分猫和狗?一文零基础入坑机器学习

640?wx_fmt=gif

导读:机器学习是一个快速发展的研究领域,主要关注设计和分析能让计算机学习的算法。作为一门新兴学科,尽管有待发掘的知识比已经掌握的知识要多得多,但当前的机器学习方法已经被用于教计算机执行各种各样有用的任务。这包括:

 

  • 图像中目标的自动检测(驾驶员辅助和自动驾驶汽车的关键组成部分)

  • 语音识别(提升语音命令技术)

  • 医学领域中的知识发现(用于增进我们对复杂疾病的理解)

  • 预测分析(用于销售和经济预测)

 

为了能让读者从整体上了解机器学习的原理,我们首先讨论一个微型机器学习问题:教计算机如何区分猫和狗的照片。通过该例子,我们采用非形式化的方式描述解决机器学习问题的一般过程。

 

作者:杰瑞米·瓦特,雷萨·博哈尼,阿格洛斯·K.卡萨格罗斯

如需转载请联系大数据(ID:hzdashuju)

 

 

01 教计算机区分猫和狗

 

在教孩子区分“猫”和“狗”时,几乎所有父母都不会告诉孩子某种形式的科学定义(例如,狗属于哺乳动物这个大类中犬科的一员,而猫属于相同大类中猫科的一员),反倒是会给孩子看一些猫和狗的图片,同时告诉他们哪些是猫哪些是狗,直到他们完全掌握这两个概念为止。

 

我们怎么知道孩子何时学会区分猫和狗了呢?直觉上,应该是当他们遇到新的猫和狗(或图片)并能够逐一正确辨识的时候。像人类一样,计算机也可以采用类似的方式学习如何执行这类任务。在机器学习领域,这种以教计算机区分不同类别事物为目标的任务被称为分类。

 

1. 收集数据

 

像人类一样,计算机也必须经过从实例中学习的训练来识别两种动物的不同之处,这些实例称为数据的训练集。图1-1展示了这样的训练集,其中包含不同的猫和狗的图片。直观而言,更大和更多样化的训练集可使计算机(或人)更好地完成学习任务,这是因为更广泛的例子可以赋予学习者更多的经验。

 

640?wx_fmt=png

▲图1-1 包含六只猫(左图)和六条狗(右图)的训练集,这个数据集用来训练区分猫和狗图片的机器学习模型

 

2. 设计特征

 

考虑一下你自己是如何区分猫和狗的图片的。为了将二者分开,你会关注什么?你可能会用颜色、大小、耳朵或鼻子的形状,以及(或者)这些特征的组合来区分它们。

 

换句话说,你不会只是简单地将图片当成许多小像素块的集合,而是会从这些图中找出细节或者特征来确定你看到的是什么。对于计算机而言也是如此。为了成功地训练计算机完成此项任务(或者任何更一般的机器学习任务),我们需要给它提供设计合理的特征,或者更理想情况下,让它自己找到这样的特征。

 

因为设计高质量的特征非常依赖于应用,所以这

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值