人车密度《Towards perspective-free object counting with deep learning》

最新推荐文章于 2024-08-05 21:52:42 发布

sunny_develop

最新推荐文章于 2024-08-05 21:52:42 发布

阅读量672

收藏

点赞数

文章标签：人群密度计数车辆密度计数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guanyuqiu/article/details/99548531

版权

最近做项目看到了Towards perspective-free object counting with deep learning这篇论文，详细读了一下，这篇博文主要是个人对文章的理解。

作者采用了两个网络一个是Counting CNN(CCNN)和Hydra CNN.CCNN产生目标的密度图(density maps),Hydra CNN使用图像多尺度特征得到最后的密度预测值。

人车密度估计的方法可以分为三类：counting by detection, counting by clustering ,counting by regression.本文的方法属于counting by regression，这种策略运算速度快，也比较精确。

1.Counting object model

本文需要对图像进行标注，车或人需要标注中心点。一幅图像对应的密度图 $D{_{I}}$ ，可以定义为每个标注点的和函数

其中 $A_{I}$ 是图像的标注点，表示归一化的二维高斯函数， $\mu$ 表示均值， $\sum$ 表示计算协方差。目标数量 $N_{I}$ 通过整个图像的密度图 $D_{I}$ 计算得到，公式如下：

所以最关键的是计算出密度图。

2.The Counting CNN

模型如下图所示：

网络是怎样工作的呢？作者在文章中给出了一个例子，给一个测试图片，首先需要对图像进行分块处理，如上图所示，CCNN的固定尺寸是72*72，所以需要把图片分割为72*72的小块，通过CCNN网络会生成密度估计图，由于两个max-pooling层，最后输出的尺寸是原来的1/4，18*18。因此所有的密度图的尺寸要重新调整为了和输入图像的尺寸一致。为了得到输入图像 $I_{t}$ 的密度图 $D_{I_{t}}$ ，需要对所有的快进行整合。由于块预测位置有重叠，所以每个密度图的最后位置必须通过块的数量进行归一化。

3. The Hydra CNN

Hydra CNN模型是为了增强模型的鲁棒性，使其能够适应更多的应用场景。该模型采用多尺度图像进行输入计算特征。

最后作者用三个数据集对模型进行了测试，感兴趣的可以看一下论文，本文就不对结果进行展示了。

sunny_develop

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

sunny_develop CSDN认证博客专家 CSDN认证企业博客

码龄14年

暂无认证

54: 原创

7万+: 周排名

83万+: 总排名

34万+: 访问

: 等级

2942: 积分

124: 粉丝

192: 获赞

111: 评论

904: 收藏

私信

关注

热门文章

分类专栏

文献 9篇
深度学习 10篇
语义分割 1篇
背景建模 3篇
目标跟踪 5篇
目标分类 4篇
图像增强 3篇
红外摄像 3篇
图像处理基础算法 9篇
python 12篇
Matlab 1篇
C++ 8篇
机器学习 7篇
caffe 1篇
tensorflow 1篇
目标检测 3篇

最新评论

《BBN:Bilateral-Branch Network with Cumulative Learning for Long-Tailed visual Recognition》简读
GG_B这孩子打小就聪明: 你好大佬，我想问一下，训练阶段，它不同的采样器采到不同的样本，最后在累计学习部分合起来分类，两个样本的标签不一样怎么分类的。感觉怪怪的。如果是同一个样本，不同的采样器又感觉没有意义了，刚看到这个论文，想借鉴，但是卡在这里，希望您可以解答。十分感谢！
Lime 代码
广东中学生: if __name__ == "__main__": result = model() result.load(os.getcwd()) # for i in range(4,5): # img = os.path.join(os.getcwd(),"miccai/{}.png".format(i)) # img = cv2.imread(img) # print("{}类别的预测结果为：{}".format(i, result.predict(img))) img = cv2.imread(os.path.join(os.getcwd(),"miccai/4.png")) explainer = lime_image.LimeImageExplainer() # 将input_image转换为RGB格式 input_image_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) input_image_rgb = np.array(input_image_rgb) predict_fn = lambda x: result.predict(x) print(result.predict(input_image_rgb)) explanation = explainer.explain_instance(input_image_rgb, predict_fn, labels=[4]) temp, mask = explanation.get_image_and_mask(explanation.top_labels[0], positive_only=True, hide_rest=True) cv2.imwrite('lime_output.png', temp) 代码如上result.predict(input_image_rgb)返回的结果就是这张图对应每个分类的得分，一个一维数组
Lime 代码
广东中学生: 你好，我的预测函数返回的是该图每个分类的得分，也就是一个一维数组，其他地方都和你一样，但是为什么我运行代码之后会提示报错，希望您看到后能帮忙回复一下，因为我已经找了一天的解决方案了： Traceback (most recent call last): File "python-process/miccai/model.py", line 187, in <module> explanation = explainer.explain_instance(input_image_rgb, predict_fn, top_labels=5) File "anaconda3/envs/pytorch/lib/python3.7/site-packages/lime/lime_image.py", line 219, in explain_instance feature_selection=self.feature_selection) File "anaconda3/envs/pytorch/lib/python3.7/site-packages/lime/lime_base.py", line 182, in explain_instance_with_data labels_column = neighborhood_labels[:, label] IndexError: too many indices for array: array is 1-dimensional, but 2 were indexed
高动态范围红外图像压缩
ljl834830593: 你好，请教一下GF&DDE，834830593@qq.com
《Contrast Limited Adaptive Histogram Equalization》
2301_76479695: 博主，请问可以发一下原文嘛？我的邮箱是1913634071@qq.com

最新文章

2022年1篇

2021年1篇

2020年10篇

2019年9篇

2018年10篇

2017年3篇

2016年22篇

2015年6篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值