写在前面
由于下一年评比奖学金开题报告成绩占很大的比重,所以特别担心拿不到一个好成绩。但是相较于对这方面有一定基础的同学,我现在做的远远不够。只能想起来什么查什么,然后再把它串成完整的体系框架,反复练习汇报。
关于深度学习
1.基于传统方法:
手工设计出具有代表性的数据来表示特征
手工设计特征提取算子
缺点:需要先验知识,模型性能依赖于设计出来的数据,不具有适应不同环境的泛化性和鲁棒性
2.基于模式识别的方法:(机器学习相关)
学习出一组从输入数据表示到输出的映射这一套规则
MLP
3.基于深度学习
CNN是一种分层的数据表示方法
高层特征表示依赖于低层特征表示,由浅入深的提取具备更高级语义信息的特征
一层提取边缘、角点、线等
二层提取颜色、纹理
三层提取抽象语义信息
网络的深度有助于模型提取更抽象的高级特征,宽度有助于模型提取更丰富的特征
4.Transformer
利用注意力捕获全局的上下文信息从而对目标建立远距离的依赖、从而提取强有力的特征
关于目标检测
在检测中,先使用CNN提取特征,然后把最后特征图的每个点看成word,这样特征图变成了一个a sequence words 从而检测输出恰好是a set objects
两阶段检测
先检测再识别:
RCNN
生成目标候选区域->特征提取(HOG->CNN)->提取后的特征图的分类及定位
Fast RCNN(2015)
输入整张图片到网络中->共享卷积层先做特征抽取再切图->ROI pooling来统一第一第二阶段的输入特征大小
Faster RCNN
端到端的识别,FasterRCNN中使用RPN代替原来的ss算法
Mask RCNN
提出了改进的ROI pooling ->ROI Align提升位置判断精度
一阶段检测:
yolo
yolov2
- 添加BN 增加2%
- 使用448*448进行微调。增加4%
- 全连接层使用anchor box
- k-means选择好的先验框
- 每个grid cell 预测5个方框
- 多尺度训练
yolov3 - 使用logisitic对方框置信度进行回归
- 使用BCE loss function
- 采用新的特征提取网络
20211104答辩完更新
练了很多遍以后一点也不紧张
其实就是慢条斯理粗中有细的一点点给老师讲清楚为什么要开题就可以了。