#今日论文推荐#CVPR 2022：字节跳动多项竞赛夺冠，发力无障碍技术创新

最新推荐文章于 2023-01-06 13:00:38 发布

wwwsxn

最新推荐文章于 2023-01-06 13:00:38 发布

阅读量232

点赞数

分类专栏：深度学习文章标签：大数据

原文链接：https://www.aminer.cn/research_report/62c7a0357cb68b460fe5c833

版权

深度学习专栏收录该内容

716 篇文章 30 订阅

订阅专栏

#今日论文推荐#CVPR 2022：字节跳动多项竞赛夺冠，发力无障碍技术创新

作为一年一度AI计算机视觉领域的顶级盛会，CVPR 2022已经落下帷幕。
字节跳动旗下的极光-多模态技术团队、智能创作团队、火山引擎多媒体实验室团队斩获了多项竞赛冠军，覆盖「视觉问答」、「图像实例分割」、「长视频内容理解」、「图片恢复」，以及「图片视频压缩技术」等场景。
其中，两项研究成果有助于视障人群克服日常生活中的视觉挑战、提升残障人士出行的安全性，助力打造无障碍环境。
‍帮助视障人士精准「识图」，视觉问答竞赛高精度技术方案夺冠

「视觉问答」是通向多模人工智能的一项基础挑战。
一个自然的应用就是帮助视障人群克服他们日常生活中的视觉挑战，如视障群体通过手机镜头捕获视觉内容，再通过语言对镜头中的内容发起提问。AI算法需要识别和描述物体或场景，并以自然语言的方式进行回答。
在CVPR 2022上，权威视觉问答竞赛VizWiz提出了新的挑战：AI在回答（Talk）有关的视觉问题时，必须精确地高亮出（Show）相应的视觉证据。

论文题目：Tell Me the Evidence? Dual Visual-Linguistic Interaction for Answer Grounding
详细解读：https://www.aminer.cn/research_report/62c7a0357cb68b460fe5c833https://www.aminer.cn/research_report/62c7a0357cb68b460fe5c833
AMiner链接：https://www.aminer.cn/?f=cs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
#今日论文推荐#CVPR 2022：字节跳动多项竞赛夺冠，发力无障碍技术创新

作为一年一度AI计算机视觉领域的顶级盛会，CVPR 2022已经落下帷幕。字节跳动旗下的极光-多模态技术团队、智能创作团队、火山引擎多媒体实验室团队斩获了多项竞赛冠军，覆盖「视觉问答」、「图像实例分割」、「长视频内容理解」、「图片恢复」，以及「图片视频压缩技术」等场景。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。