目标检测零碎笔记

李沐视频-目标检测

编译器+解释器

命令式(解释型)编程和符号式编程的区别如下:

  • 命令式编程更容易使用。在Python中,命令式编程的大部分代码都是简单易懂的。命令式编程也更容易调试,这是因为无论是获取和打印所有的中间变量值,或者使用Python的内置调试工具都更加简单;

  • 符号式编程运行效率更高,更易于移植。符号式编程更容易在编译期间优化代码,同时还能够将程序移植到与Python无关的格式中,从而允许程序在非Python环境中运行,避免了任何潜在的与Python解释器相关的性能问题。

如上所述,PyTorch是基于命令式编程并且使用动态计算图。为了能够利用符号式编程的可移植性和效率,开发人员思考能否将这两种编程模型的优点结合起来,于是就产生了torchscript。torchscript允许用户使用纯命令式编程进行开发和调试,同时能够将大多数程序转换为符号式程序,以便在需要产品级计算性能和部署时使用

小结

  • 命令式编程使得新模型的设计变得容易,因为可以依据控制流编写代码,并拥有相对成熟的Python软件生态。
  • 符号式编程要求我们先定义并且编译程序,然后再执行程序,其好处是提高了计算性能。

序列数据跟时空 是强相关的

怎么预测?1.截断2.保留过去的预测

image-20230412094108733

image-20230414154753253

你可以认为RPN就是一个小的目标检测算法 所以你能看到Faster R-CNN就是两次预测

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5JQCHtAx-1682575606947)(null)]

Mask-RCNN需要有像素级别的标号 无人车使用Mask-RCNN使用较多

SSD

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WriWZXlB-1682575599692)(…/…/Library/Application%20Support/typora-user-images/image-20230412095439937.png)]

核心思想: 我只做一次 single stage

image-20230412103425432

ssd是比较早的网络 一直没有更新 作者回家当公务员去了

image-20230412153926850

YOLO

就是快!

image-20230412154153385

量级改变 目标检测 监控摄像头 ex:真实边缘框 是有一定的规律的 用的多 写得差

image-20230412154516978

车牌识别 关键帧怎么抽取 看流派 我这么做效果 transformer 只要调的好 可以替代CNN 没有一定说要怎么样 这么样

SSD实现

image-20230417104209449v

小结

  • 在多个尺度下,我们可以生成不同尺寸的锚框来检测不同尺寸的目标。
  • 通过定义特征图的形状,我们可以决定任何图像上均匀采样的锚框的中心。
  • 我们使用输入图像在某个感受野区域内的信息,来预测输入图像上与该区域位置相近的锚框类别和偏移量。
  • 我们可以通过深入学习,在多个层次上的图像分层表示进行多尺度目标检测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值