[图像处理3]卷积神经网络的底层理解——傅里叶变换

1.引言

卷积神经网络识别的关键在于隐藏层,能够把图片的特征抽象出来,然后根据特征的线性组合(再通过激活函数增加非线性)去判断是哪个数字。

2b6ddac81048454783f88c6f14881f68.png

 输入层:把数据按照维度摊平展开,输入到神经网络里面

播放量、点赞数……每个维度代表的现实意义都是不一样的,但是图片数据有多少个像素点就有多少个维度,所有维度都是同质的,它们的意义都一样,灰度/RGB值能体现出两种数据不一样。神经网络对这些特征进行线性组合就可以做出判断了。把它们输入到神经网络后,它们可以组合成更抽象的特征。

一个图像里面到底是什么起到决定性作用的不是一个像素点具体的灰度值/RGB值,是一个像素点和其它周围像素点的相对关系。

 在图片输入到全连接神经网络之前,先对原始数据进行一个预处理,让每个像素点宝保存的不再是和图片特征关系不大的RGB数值,而是它和周围像素点存在什么关系的特征值,这样神经网络就能进行它更擅长的事情了,直接对各种特征进行线性组合而判断,而不是还要先通过全连接的方式把像素点和像素点之间的关系和特征计算出来在进行判断。

对这些像素点的信息重新填写?把这个像素点和周围像素点的关系重新填进来。

数字8上半部分模式1的特征特别明显,那么它对应的数字就比较大。(被处理的图像对于某种模式表现的明不明显,这些模式就是一个一个的特征,这些数值就是一个一个的特征值)

1cf52bb89457474e9515bf92883639da.png

 这个模式/特征用上帝视角呈现出来就是卷积核,这些特征值就是卷积核和图像计算后的结果。

特征值就是在定量的表示原始数据里面具有这个特征的强弱,定量的表现出来。但模式和模式之间是没有办法直接比较和定量表现的,不同模式的特征值之间是不能共度的。

2da5372b1e984d578c75b46f38476efb.png

 如何把这些特征值集中在一个像素点中?如何集中呢?——每个特征值前面加系数之后计算结果,不同管系数加的合不合理,后面可以用机器学习自动学习到合理的数值。

f5bf75605b47474a8a4bc395d8239dbf.png

RGB系数比较特别,相当于分别把RGB三种数据分别进行左移16位、左移8位和不移动,就可以把一个模式存储在一个像素点中,基于这样,加工后的数据再输入到神经网络里面,神经网

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值