李沐视频-目标检测
编译器+解释器
命令式(解释型)编程和符号式编程的区别如下:
-
命令式编程更容易使用。在Python中,命令式编程的大部分代码都是简单易懂的。命令式编程也更容易调试,这是因为无论是获取和打印所有的中间变量值,或者使用Python的内置调试工具都更加简单;
-
符号式编程运行效率更高,更易于移植。符号式编程更容易在编译期间优化代码,同时还能够将程序移植到与Python无关的格式中,从而允许程序在非Python环境中运行,避免了任何潜在的与Python解释器相关的性能问题。
如上所述,PyTorch是基于命令式编程并且使用动态计算图。为了能够利用符号式编程的可移植性和效率,开发人员思考能否将这两种编程模型的优点结合起来,于是就产生了torchscript。torchscript允许用户使用纯命令式编程进行开发和调试,同时能够将大多数程序转换为符号式程序,以便在需要产品级计算性能和部署时使用
小结
- 命令式编程使得新模型的设计变得容易,因为可以依据控制流编写代码,并拥有相对成熟的Python软件生态。
- 符号式编程要求我们先定义并且编译程序,然后再执行程序,其好处是提高了计算性能。
序列数据跟时空 是强相关的
怎么预测?1.截断2.保留过去的预测
你可以认为RPN就是一个小的目标检测算法 所以你能看到Faster R-CNN就是两次预测
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5JQCHtAx-1682575606947)(null)]
Mask-RCNN需要有像素级别的标号 无人车使用Mask-RCNN使用较多
SSD
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WriWZXlB-1682575599692)(…/…/Library/Application%20Support/typora-user-images/image-20230412095439937.png)]
核心思想: 我只做一次 single stage
ssd是比较早的网络 一直没有更新 作者回家当公务员去了
YOLO
就是快!
量级改变 目标检测 监控摄像头 ex:真实边缘框 是有一定的规律的 用的多 写得差
车牌识别 关键帧怎么抽取 看流派 我这么做效果 transformer 只要调的好 可以替代CNN 没有一定说要怎么样 这么样
SSD实现
v
小结¶
- 在多个尺度下,我们可以生成不同尺寸的锚框来检测不同尺寸的目标。
- 通过定义特征图的形状,我们可以决定任何图像上均匀采样的锚框的中心。
- 我们使用输入图像在某个感受野区域内的信息,来预测输入图像上与该区域位置相近的锚框类别和偏移量。
- 我们可以通过深入学习,在多个层次上的图像分层表示进行多尺度目标检测。