一方面是准备复试,一方面是因为毕业设计也是人脸检测的选题,最近想要学习一下这几年比较火的物体检测算法YOLO,参考一个教程想要复现pytorch实现该算法。参考的教程链接: link.
由于教程里面给出了cs231n关于卷积神经网络的介绍:link,我也就看了下,介绍的还是很详细,发现了很多之前并没有了解到的细节,所以记录下来,当做自己的学习笔记,同时也可以监督自己好好学习吧。
卷积神经网络结构细节
卷积神经网络结构
卷积神经网络和传统的神经网络的对比图如图:
如上图所示,一个卷积神经层有三个维度:宽度width、高度height、深度depth。
其实卷积神经网络跟传统神经网络原理没有什么不同,但是针对处理图片数据,由于一张图片包含了许多像素,而且一般来说一张彩色图像数据包含了RGB三个通道,如果仍然使用传统神经网络全连接的结构,则网络的参数过多,难以训练。所以卷积神经网络引入了卷积操作实现参数共享、池化pooling layer减少参数防止模型过拟合以及训练时间过长(也可通过加