密集场景人物检测项目

最新推荐文章于 2024-08-07 09:49:14 发布

再困也得吃

最新推荐文章于 2024-08-07 09:49:14 发布

阅读量1.3k

点赞数

分类专栏：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38208912/article/details/104287642

版权

本文介绍了一个在密集场景，如阶梯教室，进行人物检测的项目。主要挑战在于目标密集和尺度变化大。项目采用了RetinaNet检测模型，结合FPN结构来融合语义和位置信息。数据集选用CrowdedHuman，包含大量样本，每张图片平均有约23个人。在训练模型时，针对教室场景的特点调整了anchor设置，并在有限的数据量和输入尺寸限制下，使用1080ti显卡进行训练。最终模型能有效检测包括遮挡目标在内的所有人物。

摘要由CSDN通过智能技术生成

之前做了一个较密集场景下的人脸检测项目，主要场景是面向阶梯教室场景。
主要难点：

目标密集
目标尺度变化大

使用检测网络：

我们知道随着神经网络的层数的增加，其予语义信息会更丰富，但位置信息会越不准确，但同一大小的神经元的感受会越大。所以有效融合高层和低层的信息，即融合语义信息和位置信息，会对检测模型有很大提升。在这里插入图片描述
所以目前主流的检测网络均采用如（d）所示的FPN结构，由于任务场景较小，采用了Retinanet这种单阶段的检测模型。

数据集：

数据介绍：这里采用了CrowdedHuman数据集，该数据集不仅包含人头数据，也包括整体行人，和可视部分，其中样本共15000张，分三个压缩包，共339565人，平均每张约23人。
数据格式：
数据为.odgt格式，可按照python的dict直接读取。
数据样例：

最低0.47元/天解锁文章

再困也得吃

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。