#Point Transformer#
Point Transformer
自注意力网络已经彻底改变了自然语言处理,并在图像分类和目标检测等图像分析任务中取得了不错的进展。
基于以上工作成功的启发,作者研究了自注意力网络在 3D 点云处理中的应用。为点云设计了自注意力层,并利用这些自注意力层来构建自注意力网络,用于诸如语义场景分割、物体部分分割和物体分类等任务。
Point Transformer 的设计改进了之前跨领域和任务的工作。例如,在具有挑战性的大规模语义场景分割的 S3DIS 数据集上,Point Transformer 在 Area 5 上达到了 70.4% 的 mIoU,比之前最强的模型高出 3.3 个绝对百分点,并首次突破了 70% 的 mIoU 阈值。
authors | Hengshuang Zhao, Li Jiang, Jiaya Jia, Philip Torr, Vladlen Koltun
units | 牛津大学;香港中文大学;英特尔
paper | Point Transformer