rcnn 改进mask_目标检测实用中可以改进的方向

根据目前手头上的工作整理的一份清单,主要是自己的工作过程中,感觉到需要改进或者比较关注的问题,可能和一般的目标检测的研发不太一致,更多的还是些杂七杂八的点。

连续帧检测

一般的训练和评估都是针对单帧图像的,然而,实际应用中,很多都是针对连续帧(或者相近帧)的检测。

在连续帧检测上,即使在观感上,就会比较明显的感觉到不如单帧检测。

现象主要是以下:

  • 目标不能连续检出,造成检测框的闪烁
  • 偶尔的误识别
  • 检测框的偶尔跳变和漂移

c90db2a29a291c7bb34ee911b2fe41b5.png

以上就是连续两帧的图像,用COCO数据的模型。直接把没有处理的裸结果显示出来的话,观感上就非常明显了。

当然,这些都可以在工程上用一些方法来平滑掉。

但是,训练时,怎样让模型可以在连续帧上获得一个平滑的预测?包括检测框本身更加稳定的预测。

小目标、远距离检测

部分应用场景上,对识别距离是有一定的要求的,也就是对微小目标的识别。一般来说,这个需求比较小众,只有一些特殊的应用场景上需要。比如,高速上的目标识别。

在有些要求更高的场合,还需要与摄像头硬件结合,这样可以支持更远距离的目标识别。比如图森的一千米识别。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值