![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器视觉
机器视觉
王知为
人工智能领域的“项目-论文-专利-比赛”正循环。
展开
-
[TVCG论文] Point Cloud Completion: A Survey.
点云完成是在接收到部分点云输入时生成完整3D形状的任务。在3D计算机图形、视觉以及自动驾驶、机器人和增强现实等应用中,它已成为一项至关重要的过程。在过去的几年里,已经提出了许多完成算法,并进行了大量的研究。然而,目前并没有很多深入的调查综述以总结研究进展,使用户能够根据其拥有的数据类型、期望的最终结果、可能面临的挑战和可采用的可能策略做出明智的选择。在这项研究中,我们基于策略、技术、输入、输出和网络架构,全面调查和分类了截至2023年8月的有关点云完成的论文。表1 重要的期刊或会议。图2 点云补齐的方法。原创 2024-01-09 22:55:21 · 429 阅读 · 0 评论 -
3D识别的重要代码仓库
https://github.com/open-mmlab/mmdetection3dhttps://github.com/PaddlePaddle/Paddle3Dhttps://github.com/mit-han-lab/bevfusionhttps://github.com/poodarchu/Det3Dhttps://github.com/open-mmlab/OpenPCDet原创 2023-02-22 20:37:50 · 132 阅读 · 0 评论 -
[TPAMI论文阅读]Deep Learning for 3D Point Clouds: A Survey (IEEE TPAMI, 2020) Cited by 1518
近期,点云上的深度学习甚至呈现蓬勃发展的趋势,涌现出许多方法来解决该领域中的不同问题。文章还在几个公开可用的数据集上呈现了比较结果,同时提供了深刻的观察和启发性的未来研究方向。从上到下分别是:(a) 基于多视图的方法,(b) 基于分割的方法,以及 © 基于截锥体的方法。图12:基于点的方法的示意图。其中,n表示输入点的数量,M表示每个点学到的特征的维度。图10 基于深度学习的3D语义分割方法的时序概述。图13:基于深度学习的3D实例分割方法的时序概述。图7 基于深度学习的3D物体检测方法的时序概述。原创 2024-01-09 22:30:59 · 380 阅读 · 0 评论 -
医学影像数据的查看工具汇总
小赛看看-免费的医学影像DICOM浏览软件 (xiaosaiviewer.com)ITK-SNAP Home (itksnap.org)原创 2023-02-19 22:55:10 · 1185 阅读 · 0 评论 -
Open3D从入门到精通
发布时间:October 19, 2022。3D数据的库,包括c++、python。原创 2023-02-20 22:52:26 · 127 阅读 · 0 评论 -
[Optica论文阅读]--具有光谱超分辨率的血液血红蛋白移动光谱仪
尽管血液血红蛋白(Hgb)检测在各种临床情况下是一种常规程序,但无创、连续和实时的血液血红蛋白Hgb检测仍然具有挑战性。光谱可以提供无创血液Hgb量化,但需要笨重的光学组件,这从本质上限制了移动医疗(mHealth)技术的发展。笨重的光学组件,其实是可以实现无创的血液血红蛋白Hgb量化的。换句话说,采用**算法硬件化+物联网云平台**的思路,可能是有人做过相关工作了。原创 2023-02-22 00:17:56 · 163 阅读 · 0 评论 -
[arxiv论文阅读]连续建模实现大型视觉模型的可扩展学习-Sequential Modeling Enables Scalable Learning for Large Vision Models
为了组装它,我们利用了许多不同的视觉数据源:(1)未标记的图像,(2)带有视觉注释的图像,(3)未标记的视频,(4)带有视觉注释的视频,和(5)3D合成物体。不幸的是,对于视觉数据来说,不同的来源具有不同的结构。受到Shannon使用N-grams合成语言的启发[74, 75],许多作品,从Attneave的具有开创性意义的1954年的论文[5]开始,将这一想法应用于顺序合成像素[29, 32, 40, 65],图像块[28],视频帧[69]和动作捕捉数据[4, 45, 49]。带有注释的图像序列。原创 2023-12-23 19:05:21 · 96 阅读 · 1 评论 -
[arxiv论文阅读] LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding
为一个语言建模问题,涵盖了3D字幕生成、3D定位、3D问答等任务。具体而言,由于缺乏3D LiDAR-文本配对数据,我们引入了一个三阶段的训练策略,并生成相关数据集,逐步将3D模态与LLMs的语言嵌入空间对齐。LiDAR-LLM在3D字幕生成任务上取得了40.9的BLEU-1,而在3D定位任务上实现了63.1%的分类准确率和14.3%的BEV mIoU。我们提出的LiDAR-LLM以3D LiDAR数据为输入,并将3D模态与语言嵌入空间对齐,充分利用LLM的卓越推理能力来理解户外3D场景。原创 2024-01-06 17:08:11 · 1062 阅读 · 0 评论