字节跳动新框架:图片中遮挡关系如何判断?(附源代码)

关注并星标

从此不迷路

计算机视觉研究院

12c2d351f83be1be21c16507acbcd399.gif

507679a4130dd39c988173ddb8311afe.gif

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

db45d98613880a9a713f3f17680fccea.png

  • 论文链接:https://arxiv.org/abs/2108.05722

  • 代码链接:https://github.com/fengpanhe/MT-ORL

计算机视觉研究院专栏

作者:Edison_G

到底是谁挡住了谁?遮挡边界又在哪里?对于人类来说,物体之间的遮挡关系非常容易判断,但对于 AI 来说,这个任务就没那么简单了。转自于《机器之心》

84797da02df451c35c52af52108029e2.png

传统方法存在哪些问题?

243bb5661104a5e158375e25994c9056.jpeg

37e61d182bf3789e685ea4999f5c6505.jpeg

新方法有何创新之处?

d060bb0c75a152b2def107c7a7422b2f.jpeg

遮挡共享和路径分离网络

本文提出的遮挡共享和路径分离网络(OPNet)如下图所示:

a852dbe24f267d9405add7ddef02ea50.png

094c8130b493d4fbd25409dd2b9e347e.jpeg

1593ec4e3621370dcb58872f094c64c3.jpeg

遮挡方向的正交遮挡表示法

下图展示了四种基于边界的遮挡方向表示示意图。

be9dd19575a189307f05c6321b5efc4c.png

4937c82de3a5202f13dd6ab0cca2e392.png

a963d5cc0041acabf09f7e0c527ce9ad.png

bf7456c1dcc9a7f9f97cc764ee61b78c.png

b2d531f2fe6669dea640e0e78fbdd6c3.png

59fc5bc68dcb4b22f6e7970867b19188.png

实验结果

作者分别在 PIOD 和 BSDS ownership 两个数据集上评估了模型和方法的有效性。

8b3ae468486f765436d208ef422af26b.png

f3ca9af959398fbf44b035f8c9f30857.png

d428947288ea88d7f84313aaf7db5433.png

下图是预测结果的可视化比较。如图,作者的方案在边界和遮挡关系的预测上都有明显的提升。

7dea85c8cada6190602772764cd99cab.png

总结

80c5e0fca4bf0d1e7a2a675a340c7a5a.png

© THE END 

转载请联系本公众号获得授权

d83699b54fe3f661600b0c6f2ab7fbd5.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

b56cc7393f371940c02ee14047ec7b3a.jpeg

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

 往期推荐 

🔗

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值