作者:泡椒味的口香糖 | 来源:3D视觉工坊
在公众号「3D视觉工坊」后台,回复「原论文」可获取论文pdf和代码链接
添加微信:dddvisiona,备注:3D点云,拉你入群。文末附行业细分群
0. 笔者个人体会
实例分割是CV领域很经典的任务,应用也非常广泛。但一个比较头疼的点是需要预定义类别,训练和测试都只能针对固定的类别。
最近,笔者阅读了一篇NeurlPS 2023开源的方案OpenMask3D,可以根据输入词汇直接分割模型,关键是输入的词汇非常任意,比如"印有花卉图案的扶手椅",可以很好得跟其他类别区分开。
今天笔者将为大家分享这项工作,当然笔者水平有限,如果有理解不当的地方欢迎大家一起讨论~
1. 效果展示
OpenMask3D声称是第一个开放词汇3D实例分割模型,也就是输入词汇,分割对应的3D实例。神奇的是它甚至可以识别颜色、几何、材料、位置、临近关系等语义信息。比如输入"脚凳"、"上面有一个花瓶的边桌""一个白色的枕头"、"放着花瓶的边桌"、"