神经网络目标检测
神经网络的类型
- 全连接层神经网络
前向计算简单、梯度求导简单,但参数量大,训练困难 - 卷积神经网络
利用局部相关性和权值共享思想,在计算机视觉方面表现出色,但不擅长自然语言 - 循环神经网络
广泛应用于自然语言和长序列问题,但训练不稳定,难以并行化 - 注意力神经网络
最初在图像分类任务上提出,后来也应用于NLP等领域 - 图神经网络
处理空间拓扑结构
为了实现树莓派的图像识别,暂时只关注卷积神经网络并且为了制作一辆能够自主循迹,识别物体并且实现抓取功能的小车,我们暂时只学习卷积神经网络的区域模型(即区域目标检测,而非简单的图形识别或分类)
内容主要包括四种卷积网络
- R-CNN
- Fast R-CNN
- YOLO
- SSD
首先明确目标检测与图像分类的不同:目标检测要求在图像中确定多个可能目标的位置,首先判断是否存在目标,如果存在再进行分类
R-CNN
采用滑动窗口利用区域识别进行目标检测
包括三个模块:区域推荐、特征提取、区域分类
- 区域推荐:将输入图像生成约2000个区域推荐构成候选检测集。推荐的方法时选择性搜索
- 特征提取:从每个区域推荐中提取固定长度为4096的特征向量,利用卷积网络计算每个区域推荐的特征值
- 区域分类:对每个推荐区域进行打分和筛选,先采用类别相关的线性支持向量机对特征向量打分,