CNN基础:
实现对图像的高准确率识别离不开一种叫做卷积神经网络的技术。卷积神经网络主要是应用于计算机视觉任务当中,但是他处理的任务不只是局限于图像,其实语音识别是也可以使用卷机神经网络。
什么是卷积?
我们人眼看到的和计算机看到的是不一样的,我们看到是图上左边的狗狗,而计算机看到的是右边的一堆数字(像素值)。当我们人类对图像进行分类的时候,这些数字毫无用处,可他们确实计算机可以获得唯一输入。
现在的问题是:当你提供给计算机这一组数据后,他将输出描述该图像的某一特定分类的概率(比如:80%是猫、15%是狗、5%是年)。
我们人类是通过特征来区分猫和狗,现在用计算机来区分猫和狗的图片,就要计算机搞清楚猫猫狗狗各自的特征。计算机可以通过寻找诸如边缘和曲线之类的低级特点来分类图片,继而通过一系列卷积层构建出更为抽象的概念。这是CNN(卷积神经网络)工作方式的大体描述。
为什么叫卷积:CNN的确是从视觉皮层的生物学上启发的。简单地来说,视觉皮层上有小部分细胞对特定部分的视觉区域敏感。列如