【原创 深度学习与TensorFlow 动手实践系列 - 4】第四课:卷积神经网络 - 高级篇
提纲:
1. AlexNet:现代神经网络起源
2. VGG:AlexNet增强版
3. GoogleNet:多维度识别
4. ResNet:机器超越人类识别
5. DeepFace:结构化图片的特殊处理
6. U-Net:图片生成网络
7. 实例:剖析VGG,用模型进行模型参数可视化,特征提取,目标预测
期待目标:
1. 掌握AlexNet结构特点,神经网络各层之间特征传导关系,模型参数总数计算
2. 了解VGG,GoogLeNet,ResNet等复杂ImageNet模型的结构特点,简单设计思想
3. 针对特殊数据,特殊任务设计的神经网络结构
4. 深度剖析VGG TF代码,学会对已有模型进行参数读取,目标预测,特征提取。
AlexNet:现代神经网络起源
背景介绍:
ImageNet Challenge:1000类物体,每类1000张图片
传统方法思路:
1. 图片特征提取
2. 机器学习分类
背景介绍:
2010年冠军
System Overview
Dense Grid descriptor:HOG,LBP
Coding:Local coordinate super-vector
Pooling, SPM
Linear SVM
2011年冠军:Xerox Lab
1. 特征提取
2. Fisher 压缩
3. SVM分类
VGG:AlexNet增强版
1. VGG-AlexNet 对比卷积层 - 卷积群参数个数:138m - 60m
2. 识别率(top5)7.3% - 15.3%
VGG作用:
1. 结构简单:同AlexNet结构类似,均为卷积层,池化层,全连接层的组合。
2. 性能优异:同AlexNet提升明显,同GoogleNet,ResNet相比,表现接近。
3. 选择最多的基本模型:方便进行结构的优化,设计,SSD,RCNN,等其他任务的基本模型(base model)
1. 为什么ResNet有效?
1. 前向计算:低层卷积网络高层卷经济网络信息融合;层数越深,模型的表现力越强。
2. 反向计算:导数传递更直接,越过模型,直达各层。
人脸识别数据特点:
结构化:所有人脸,组成相似,理论上能够实现对齐
差异化:相同位置,形貌不同