学习笔记-卷积神经网络（3）

最新推荐文章于 2024-11-05 17:18:24 发布

科研鬼才

最新推荐文章于 2024-11-05 17:18:24 发布

阅读量220

点赞数 1

文章标签：深度学习神经网络计算机视觉

本文链接：https://blog.csdn.net/weixin_42447868/article/details/103915176

版权

实现卷积神经网络
迁移学习
（1）下载神经网络开源的实现（代码和权重）
（2）训练集少的情况下，冻结层，保留一个层来训练，在此之上再训练softmax层，改变softmax层的预测
（3）训练集多的情况下，冻结前面较少的层，训练后面的层，构建自己的输出单元。
（4）利用大量数据，重新训练每一层，更新每层的权重。
———————————————————————————————————————
计算机视觉现状
深度学习已经成功地应用于计算机视觉，自然语言处理，语音识别，在线广告等
1.手工工程 2.标签数据
——————————————————————————————————————
目标检测-目标定位
1.训练集不仅包含神经网络需要预测的对象分类标签，还包含表示边界框（Bounding Box）的四个数字（边界框的中心点，框长和框宽）
Example：
1.pedestrian 2.car 3.motorcycle 4.background
Need to output：（Bx，By），Bh，Bw，class label（1-4）
窗口滑动目标检测
以某个步幅在图像中滑动窗口，遍历整张图片，判断目标是否在窗口中。每一个窗口利用卷积网络进行处理。计算成本较高，速度慢
通过卷积实现滑动窗口对象检测
输出精准的边界框——YOLO
主题思想：将图像进行网格划分，将检测对象的中点分配到其中点所在的格子，即使对象可以横跨多个格子，也只会被分配到其中的一个格子当中。
运行速度快，通过单次卷积处理图像。
交并比（loU）函数
计算两个边界框交集部分和并集部分之比。
一般约定，计算机视觉中，如果loU大于或等于0.5，说明检测正确。0.5阈值来判断预测的边界框是否正确。衡量定位精确度的一种方式。
非极大值抑制
清除重复的检测对象，对目标对象只检测一次。只输出检测概率最大的分类结果，利用概率最大的结果来抑制其他检测概率较小的检测结果。
1.设置某个阈值大小，当检测结果是目标物的概率小于该阈值时，则抑制输出；如果大于该阈值，则输出检测结果。
2.经过第一步筛选后，还存在与检测概率最大的输出边界框面积重合较高的边界框时，设置交并比的阈值大小，清除这些占比较高的边界框，只留下最终的输出结果。