本文按照北京邮电大学计算机学院鲁鹏老师的计算机视觉与深度学习课程按章节进行整理,需要的同学可借此系统学习该课程详尽知识~
第八章 视觉识别
视觉识别任务分类
分类任务前面章节已有介绍,本节不再赘述。
语义分割
语义分割定义
语义分割思路
1.滑动窗口
2.全卷积
全卷积优化
1)反池化操作: Unpooling
2)反池化操作: Max Unpooling
3)转置卷积:Transpose Convolution
回顾卷积操作
转置卷积操作
重叠区域求和一维示例
目标检测
目标检测定义
目标检测类别
1.单目标检测
2.多目标检测
CNN
R-CNN
Fast R-CNN
重点知识
区域裁剪:ROI Pool
区域裁剪:ROI Align
Faster R-CNN
重点知识
区域建议:Region Proposal Network
问题:是否必须采用两个阶段范式完成目标检测?
一阶段目标检测: YOLO / SSD / RetinaNet
目标检测总结
实例分割
实例分割定义
实例分割思路
Mask R-CNN
附:Open Source Frameworks
TensorFlow DetectionAPI:Faster RCNN, SSD, RFCN, Mask R-CNN
Caffe2 Detectron:Mask R-CNN, RetinaNet, Faster R-CNN, RPN, Fast R-CNN, R-FCN