计算机是如何读懂图片的

照片对于计算机而言,仅仅是一推像素,它可不像人类那样能辨别出照片里面的实物。如下面的在一个28*28像素的白纸上写上“2”,计算机是如何读懂的呢?

对于很多没接触过人工智能的同学们,输入层、卷积层、池化层等这些名词,都太陌生了,在这里就用大家都能看得懂的名词“概率”来做分析。换句话来说,图像识别的最基本的逻辑便是一个概率的问题。

1、在我们认知事物之前,首先需要学习,计算机也不例外,在这里我们就以0~9的数字识别为例。学习就是要告诉计算机0~9都长什么样,比如下面就是我们告诉计算机,这就是0~9的模样(也就是特征工程,这时人工智能最耗时耗力的环节,这里先略过),而计算机能学习到,不过是这些图像的像素点位置与色值。

 

 2、已经有了前面的学习基础,接下来就是应用阶段。回到我们前面提到的那个“2”,当把那张图片摆在计算机面前时,计算机是一个像素一个像素的去获取其对应的灰度值(实际上是RGB值,为了简单处理,我们可以进行灰度处理,只剩下一个明度值,也就是灰度值)

每个像素的灰度值都是一个输入值,而图像的大小是28*28像素,那么该图片就是28*28个输入值,这其中有白色(#ffffff)和非白色,而计算机能做到就是“记住”这些白点和非白点的位置和色值,然后和之前学习到的不同数字的白点和非白点的位置和色值做比较。最后得到一个概率值,比如和0相比较,它们的吻合度为51%;和1相比,它们的吻合度为31%;和2相比,它们的吻合度为97%,和3相比......,而最后计算机输出的是吻合度最高的那个数值。

这便是计算机读懂图片的底层逻辑。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值