1、突破性CNN架构的资料
(1)论文、文档、实现和数据集
AlexNet论文:http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
VGGNet论文:https://arxiv.org/pdf/1409.1556.pdf
ResNet论文:https://arxiv.org/pdf/1512.03385v1.pdf
Keras上关于CNN著名架构的文档:https://keras.io/applications/
梯度消失:http://neuralnetworksanddeeplearning.com/chap5.html
Git上项目:https://github.com/jcjohnson/cnn-benchmarks
ImageNet大赛:http://www.image-net.org/challenges/LSVRC/
ImageNet:1000万张图片,1000类。2010年起每年开始举办。
(2)AlexNet、VGGNet、ResNet
AlexNet,2012年多伦多大学研发,11*11卷积窗口
VGGNet,牛津大学2014年研发,有VGG16层和VGG19层两种。3*3的卷积层,穿插2*2的池化层,最后加3个全连接层。
ResNet,微软2015年研发,与VGG类似,都是同一结构不断重复。而且深度更深,最深达到152层。另外,通过“添加跳过层级的梯度传播”,解决了“梯度消失的问题”。
2、实战
(1)deep dreams(需要翻墙看)
3、可视化举例:5层神经网络
论文:http://www.matthewzeiler.com/wp-content/uploads/2017/07/eccv2014.pdf
- 第一层:识别线条和色块
- 第二层:识别圆圈、条纹、长方形
- 第三层:识别网格、蜂窝甚至面孔
- 第五层:最高级识别。识别出狗脸,鸟脸,自行车等。