CNN 有两大特点:
能够有效的将大数据量的图片降维成小数据量。
能够有效的保留图片特征,符合图片处理的原则。
在CNN出现之前,图像的处理对于人工智能来说,是一个难题。有两个原因:
图片需要处理的数据量太大,导致成本高,效率低。
图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率不高。
需要处理的数据量太大:
图片是由像素构成,每个像素又是由RGB三个参数来表示颜色。
比如,一个10001000 像素的图像,就是10001000 个方块,每个方块都是由RGB三个值来表示。
卷积神经网络-CNN 解决的第一个问题就是将复杂的问题简单化,把大量的参数降维成少量参数,再做处理。
更重要的是:在大部分场景下,降维并不会影响结果。比如10001000 像素的图片缩小成200200 的像素,并不影响肉眼认出来图片中是什么物体,机器也是如此。
人类的视觉原理
深度学习的许多研究成果,离不开对大脑认知原理的研究,尤其是视觉原理的研究。
“ 视觉系统的信息处理 ”:可视皮层是分级的。
人类的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状