最近尝试做图像识别,在网上查了一下资料,发现用卷积神经网络方法比较好。既简单,少了很多预处理过程,而且图像识别的精度也比较高,所以决定用CNN来做这次的图像识别。
在正式学习之前,简单对当下几种流行算法做了下对比,选择的比较随机,有遗漏。
下面详细介绍一下卷积神经网络。
卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。
与普通神经网络相比,它们都由具有可学习的权重和偏置常量(biases)的神经元组成。每个神经元都接收一些输入,并做一些点积计算,输出是每个分类的分数,普通神经网络里的一些计算技巧到这里依旧适用。不同点在于,卷积神经网络的默认输入是图像,把神经元设计成三个维度 : width, height, depth。比如输入的图片大小是 32 × 32 × 3 (rgb),那么输入神经元就也具有 32×32×3 的维度。
一个卷积神经网络由很多层组成,它们的输入是三维的,输出也是三维的,有的层有参数,有的层不需要参数。
参考:https://blog.csdn.net/qq_25762497/article/details/51052861