1 基本卷积神经网络
- AlexNet
![](https://i-blog.csdnimg.cn/blog_migrate/f08e4e0d2749765de74030973a6147df.png)
- VGG-16
![](https://i-blog.csdnimg.cn/blog_migrate/a64b7768caefe52d61e39ecfe6955e11.jpeg)
- 残差网络
搭建步骤:
- 使用VGG公式搭建Plain VGG网络
- 在Plain VGG的卷积网络之间插入Identity Mapping,注意需要升维或者降维的时候加入 1×1 卷积。
- Inception网
![](https://i-blog.csdnimg.cn/blog_migrate/0f5b6abb8b57e432dc4fa1c8e415cf86.png)
2 常用数据集
- MNIST
- PASCAL VOC
- MS COCO
- ImageNet
3 算法评估
3.1 基本概念
P(精确率): TP/(TP+FP)
R(召回率): TP/(TP+FN)
召回率越高,准确度越低。调整阈值可改变准确率或召回值。
名称 | 含义 |
True positives (TP) | 被正确地划分为正例的个数 |
False positives (FP) | 被错误地划分为正例的个数 |
False negatives (FN) | 被错误地划分为负例的个数 |
True negatives (TN) | 被正确地划分为负例的个数 |
3.2 指标计算
mAP:均值平均准确率
4 目标检测与YOLO
- 目标检测:在给定的图片中精确找到物体所在位置,并标注出物体的类别。 物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图 片的任何地方,并且物体还可以是多个类别。
- YOLO:You Only Look Once,只需要浏览一次就可以识别出图中的物体的类别和位置。