- 博客(6599)
- 资源 (35)
- 收藏
- 关注
转载 大规模3D高斯重建!HeadsUp:10000+受试者训练,无需测试优化
依托万级受试者大规模数据与多样表情数据训练,方法在完全未见过的新身份上仍具备优异渲染能力,可精准还原睫毛、耳饰、牙齿、舌头等高精细高频细节。图中均为训练集未见新身份的渲染结果。的SOTA高质量重建渲染。我们系统性分析模型在身份数量、视图数量、模型容量上的缩放行为,提炼出质量与计算开销权衡的实用结论。以标准人头模板UV拓扑为约束,把所有3D高斯的属性编码到UV贴图上,高斯总数固定、与输入视图数量和分辨率无关,实现解耦。:传统3D高斯随输入视图/分辨率升高,高斯数量暴涨,计算与显存开销不可控,无法规模化训练。
2026-05-28 07:00:00
155
转载 一模双擎三端破局:灵境引擎3.0开启具身智能的「物理真实」训练新范式
更重要的是,孪界科技拥有超过10年的工程数字孪生实践,这意味着“一模”的资产底座并非从零开始,而是建立在海量、高质量的真实工程数据(覆盖水利、机场、地铁、油田等重大基础设施)之上,并支持100+种主流三维工程格式的原生转换,确保了数字资产与物理世界的高保真映射。展望未来,这一“数字基座”的价值将愈发凸显。因此,孪界科技通过“灵境”与“衍象”的协同,为机器人抓取、自动驾驶、具身智能提供了可靠的“数字训练场”,旨在为具身智能理解物理世界提供数据燃料,大幅降低了在真实世界中试错的高昂成本与风险。
2026-05-28 07:00:00
140
原创 支持10亿高斯点!群核科技开源3D高斯浏览器:比Spark 2.0 渲染速度快3倍,无需专业GPU!
20多门3D视觉系统课程、3DGS独家系列视频教程、顶会论文最新解读、海量3D视觉行业源码、项目承接、求职招聘。高性能渲染引擎,通过细粒度参数设置,选择从效果优先到极限性能不同路径,简化渲染链路并减少内存和显存占用。把 3DGS 重建空间转换为可查询的碰撞边界,为行走模式、相机避障、区域限制和空间交互提供稳定约束。完整工具链支持-覆盖转换、LOD、编辑、拾取和生成体素碰撞体。提供多格式、LOD和体素碰撞体生成以及编辑、拾取等必要能力。想要入门3D视觉、做项目、搞科研,欢迎加入!
2026-05-27 07:00:00
595
转载 SIGGRAPH‘26 | 清华开源Pixal3D:1张图像重建高保真3D模型,精细几何纹理!
我们认为,这一问题的根源在于2D与3D之间的对应关系不够明确:大多数3D生成方法都是在标准空间中构建模型,再通过注意力机制将图像特征融入其中,这样一来,像素与3D模型的对应关系就变得模糊不清了。具体来说,我们将图像特征反投影到3D体积中:沿射线的每个3D体素都被赋予对应的像素特征,从而生成一个像素对齐的、提升后的3D特征体积。通过这些精心设计,我们证明了这种像素对齐的3D生成范式不仅可行且可扩展以生成高质量3D模型,而且相较于当前的3D生成方法显著提高了3D保真度,达到了接近重建水平的保真度。
2026-05-26 07:00:00
122
原创 地平线最新提出HorizonDrive:自动驾驶世界模型新范式、实现分钟级自回归生成
HorizonDrive 没有一上来就只盯着 student 做抗漂移训练,而是增加了额外的一步训练,让前面的可控世界模型具备修复误差的能力,这一步的难点是如何让模型看见自己生成的误差,并提供有效的监督。因此,HorizonDrive 采取了一种课程学习的方式,让平滑过渡的窗口由小变大,提升了模型的收敛性。HorizonDrive走通了一条看起来很难的路:不依赖显式 3D、不依赖额外 cache 或 memory 机制,仅通过一套自纠正的训练范式,就能让模型处理复杂的误差累积,达到长时序生成的效果。
2026-05-25 07:00:00
598
转载 CVPR‘26 Highlight 开源|Vista4D:一段视频→任意运镜,任意编辑!
研究方向为多模态模型、3D/4D 重建,以及新视角合成与可控生成。在攻读本科与博士期间,曾在 Netflix Eyeline Labs 和 Snap Research 担任研究实习生(Vista4D 即在 Netflix Eyeline Labs 实习期间完成)。CVPR'26 Highlight 开源|Vista4D:一段视频→任意运镜,任意编辑!3D视觉工坊很荣幸邀请到了哥伦比亚大学计算机科学博一。Vista4D 开源讲解:代码、模型、UI与评测数据。Vista4D 的下游应用:4D 场景编辑与扩展。
2026-05-25 07:00:00
95
转载 SLAM技术路线收敛?不,多模态融合正在重启路线之争
知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。
2026-05-24 00:00:00
102
转载 一文详解改进的三频三步相移结构光三维重建方法
随后推导了该方法的求解原理,由最高频的3张条纹图直接求得重建所需包裹相位,另外两张条纹图用于对包裹相位进行展开,理论上该方法与传统三频三步算法具有相同的精度。下面通过4个实验分别就算法的测量精度、对不连续物体的重建能力以及算法对不同光强的重建稳定性和重建彩色物体的鲁棒性进行验证。该方法与传统三频三步方法均需要3种频率的正弦条纹图,但条纹图数量只需5张,即最高频率的条纹图3张,但初始相位不同,剩余频率的条纹图各1张。(图2(b)、(c)位置)分别为通过三步相移图像计算得到的各个频率的背景光强和调制光强。
2026-05-24 00:00:00
107
转载 SLAM技术路线已收敛?多模态融合如何重启路线之争
知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。
2026-05-24 00:00:00
102
转载 感知与建图,为什么不能只跑一个 SLAM Demo?
知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。
2026-05-23 00:00:00
74
转载 9项SOTA!参数最少推理最快!MC4AD从力学角度攻克3D异常检测,5大数据集全面霸榜!
通过DA-Gen模拟多样化异常、CFP-Net利用互补表示预测矫正力、对称损失与整体损失约束矫正效果、HQC分层质量控制策略提升推理效率,MC4AD在5个现有数据集及自建数据集上取得了9项SOTA,同时实现了参数量最少和推理速度最快。提出了从力学角度审视缺陷来源的全新3D异常检测视角,认为大多数异常源于内部和外部不可预测的缺陷力,并引入MC4AD框架为每个点生成内部和外部矫正力。设计了DA-Gen模块用于模拟多种类型的异常,以及CFP-Net利用互补表示进行点级分析,模拟内部和外部矫正力的不同贡献。
2026-05-23 00:00:00
78
转载 3万条真实轨迹!UAV-Flow首个语言引导无人机精细控制基准,VLA模型开放环境首飞!
无人机正在演变为语言交互平台,实现更直观的人机交互。虽然先前的工作主要集中在高层规划和长距离导航上,但我们将注意力转向语言引导的精细轨迹控制,即无人机根据语言指令执行短距离、反应式的飞行动作。@「3D视觉工坊」编译。——无人机通过模仿人类专家飞行员的轨迹来学习执行原子化的语言指令,实现短距离、反应式的精细飞行动作(如"绕树飞行"、"在桥上方悬停"、"从右侧穿过"等)。提出了 Flying-on-a-Word(Flow)任务范式,将语言引导无人机控制从"飞得更远"转向"飞得更好",聚焦短距离精细轨迹控制。
2026-05-22 07:00:00
94
转载 无需贴点+760万点/秒!精度0.023mm+单站覆盖156m³!FreeScan Trak系列跟踪式激光三维扫描仪来袭
近日,先临三维对该系列产品进行全面升级,焕新打造FreeScan Trak Nova+双核无线跟踪激光三维扫描系统与FreeScan Trak ProW+无线大范围跟踪式激光三维扫描系统,为全球三维扫描用户带来全新体验,进一步推动工业测量向高效化、精准化、便捷化升级。两种模式还可配合使用,用户可在同一工程下,先使用大幅面激光手持模式快速获取全局数据,再切换至便携式跟踪模式完善局部细节特征,两次扫描的数据能够自动融合,显著提升复杂工件的整体扫描效率与数据完整性。,让大型工件的全方位测量变得前所未有的流畅。
2026-05-22 07:00:00
62
转载 CVPR‘26 | 复旦大学x引望:DynamicVGGT-基于动态点图的自动驾驶4D场景重建
近年来3D基础模型在几何感知与静态场景重建领域持续突破,但难以适配自动驾驶的真实动态环境,前馈 3D 模型的动态建模能力,已成为4D场景重建的核心攻关方向。复旦大学联合引望 2030Lab 团队,并未重构原有框架,而是在偏静态3D感知的VGGT基础上,补齐“时间”与“运动”两大核心能力,将其扩展为面向自动驾驶场景的统一4D动态重建框架。研究方向为自动驾驶3D视觉感知,在ICRA,AAAI,CVPR等会议或期刊发表多篇论文。:3D视觉工坊很荣幸邀请到了复旦大学在读博士。3D视觉工坊哔哩哔哩。
2026-05-21 09:55:21
90
转载 太原科技大学李岩团队ELTDF-Net:基于局部感知残差门控多频域卷积注意力PAUT焊接缺陷检测模型
智能检测模型,专治PAUT图像检测的各种“疑难杂症”!模型检测性能显著领先:提出的ELTDF-Net在PAUT焊接缺陷检测任务中表现卓越,在工业实测PAUT-Welds数据集上Top-1准确率达86.36%(AUC值0.96),在NEU-CLS-64、NEU-CLS、磁瓦(MT)公开数据集上Top-1准确率分别达97.44%、99.72%、84.97%,全面优于ConvMixer、Eva-02、Res2Net等11款主流模型,在精确率、召回率、F1-score上实现三维度领先,鲁棒性和细粒度识别能力突出。
2026-05-21 07:00:00
80
转载 苏州三迪斯维!高精度3D相机!支持户外、焊接、喷涂、机械臂抓取和视觉测量等!
SD-M系列三合一3D相机,支持面阵扫描、摆动线扫和固定线扫三种模式,主要适用高精度测量、焊接、喷涂等领域!KW系列3D相机主要适用工件上下料、拆码垛、机器人视觉引导、工业测量等多种应用场景。▲长按添加小助理微信:cv3d007 或者 13451707958,咨询更多。▲长按添加小助理微信:cv3d007 或者 13451707958,咨询更多。KW系列3D相机-适用于机械臂抓取、测量场景。KW-Lumos-W!KW-Lumos-W!SD-M2600重建不同物体效果展示。线激光3D相机-SD-M2600。
2026-05-20 08:58:11
101
转载 港科大沈劭劼、谭平团队重磅开源!H-OmniStereo:280万全景数据集,实现零样本360°立体匹配!
此外,同一经度上的像素共享相同的坐标系,以确保上下视图对之间的一致性。为了应对这些挑战,我们提出了H-OmniStereo,一个全向立体匹配框架,该框架利用大规模合成立体数据集和在航向对齐坐标系下的全向单目法线先验,实现了高精度和零样本泛化能力。总体而言,与现有数据集相比,我们的数据集在多样性上大幅提升,规模约为最大已有数据集的70倍,为训练具有零样本泛化能力的全向立体匹配模型提供了坚实的基础。我们将我们的方法与最近的全向立体匹配方法进行比较,使用它们官方提供的在其自身数据集上训练得到的检查点。
2026-05-20 07:00:00
69
转载 苏州三迪斯维!SD-M系列!三合一高精度结构光3D相机!支持户外和焊接场景!支持面阵扫描、摆动线扫和固定线扫三种模式!
出品的SD-M系列三合一3D相机采用主动结构光技术,拍摄速度快、成像精细、方案成熟稳定,针对不同应用场景物体可输出高质量点云数据图,精度高、速度快、环境自适应性强。SD-M51000重建不同物体效果展示。SD-M52000重建不同物体效果展示。:支持面阵扫描、摆动线扫和固定线扫。SD-M2600重建不同物体效果展示。户外番茄(SD-M2600C)汽车内饰板(M52000C)SD-M51000,实物图。SD-M52000,实物图。线激光3D相机-M2600。SD-M2600,标准款。L型钢材(线扫效果)
2026-05-20 07:00:00
92
转载 零样本抓取成功率 88%!ORACLE-Grasp 凭 LMM 语义赋能机器人智能抓取!
在包含日常物体和AI生成物体的多样化RGB和RGB-D图像上的评估结果表明,该方法生成的抓取在物理上可行且语义上恰当,与人类标注高度一致,在真实世界的抓取任务中取得了高成功率。ORACLE-Grasp提出了一种将LMM语义推理与经典计算机视觉技术相结合的混合抓取框架,在未知物体上实现了稳健的、任务相关的抓取预测。提出了ORACLE-Grasp,一种新颖的零样本可供性对齐抓取框架,利用LMM作为语义Oracle推断类人抓取,无需任何训练、抓取标签或自定义编码器。,而非传统的自由形式生成任务。
2026-05-19 07:00:00
106
转载 CVPR‘26 Oral开源 | VGGT团队重磅VGGT-Ω:革新三维重建和位姿估计,精度暴涨77%
我们在架构、数据和训练方面改进了原始VGGT,引入了寄存器注意力,使用了带多任务损失的单一密集预测头,一个处理动态内容的大规模标注流程,以及一个利用海量无标签视频的自监督训练协议。如表2所示,我们的模型在静态基准测试中优于基线,在现有方法表现强劲的数据集(如ETH3D)上进一步降低了AbsRel,在动态场景中更是如此,降低了深度误差并提高了δ1.25(例如,在Sintel上,δ1.25从86.1提升到93.5,AbsRel从0.118降至0.081)。我们将VGGT中冗余的密集头替换为仅训练时的损失。
2026-05-18 07:03:10
391
转载 三维重建下半场,拼的全是底层基建实力!
知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。
2026-05-17 00:01:16
100
原创 CVPR2026 | DualPrim:基于正负双基元的紧凑结构化三维重建
与仅采用叠加的隐式或基元重建方法不同,DualPrim使用正和负两种超二次曲面基元共同表示形状:正基元用于构造,负基元用于雕刻,正基元与负基元相减的表示方式可以实现对孔洞、凹面等复杂拓扑的建模。基于基元的方法,包括Marching Primitives、CapriNet、D2CSG、DiffCSG、EMS、MeshAnything与PrimitiveAnything,能够得到紧凑且可解释的网格,但其重建质量依赖底层SDF,易受噪声影响。该方法采用紧凑且可微的基元化表示,能够无缝集成到体渲染管线中。
2026-05-17 00:01:16
457
原创 ICML‘26开源 | AmbiSuR:首次直击3DGS光度歧义!全新三维重建精度SOTA,原生支持VGGT-Ω/DA3即插即用!
在监督层,我们设计了一种基于球谐函数的内在指示器。通过将球谐函数拓展为多义性自指示器,并辅以基元截断与光线-颜色一致性,该方法无需繁复的冗余计算,仅依赖3DGS核心计算即可实现几何重建的自我识错,与现有架构高度兼容,在多个基准上达到了全面的最佳重建精度。在表征层,光度消歧模块由两部分组成:1) 高斯基元截断:以标准差界定基元核心,在计算渲染不透明度时丢弃边缘,阻断弱梯度引发的膨胀,迫使基元保持紧凑。一种高斯溅射光度消歧模块,用于处理3DGS中两种固有的基元级歧义,约束不适定的几何求解,以形成确定的表面。
2026-05-16 00:01:14
477
转载 做3D视觉整整8年:吃透三维重建、SLAM、具身智能、自动驾驶等核心前沿技术……
知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。,作为补充拓展内容,聚焦行业新技术、热点方向,供大家延伸参考。
2026-05-16 00:01:14
91
转载 从Spark 2.0到世界模型:3DGS正在重塑机器人与真实世界的底层交互逻辑
近两年,一个原本属于计算机图形学与三维重建领域的技术 —— 3D Gaussian Splatting(3DGS)(Kerbl et al., 2023)—— 正在快速 “出圈”。尽管前景清晰,但工程实践仍存在门槛:理论复杂(体渲染、球谐函数等)、工程链路长(SfM/MVS → NeRF → 3DGS)、性能优化困难(GPU 与数据结构)。其共同指向是:构建一个统一的 “更值得关注的是,这种演进不再局限于 “渲染更快”,而开始指向一个更宏大的问题:机器如何在真实世界中构建、维护并使用一个可计算的三维表示。
2026-05-15 07:02:10
109
转载 3D结构光相机 | 抓取/焊接/测量全搞定,高反光&黑色物体重建精度高,工业场景全覆盖,户外无惧强光
KW系列3D相机主要适用工件上下料、拆码垛、机器人视觉引导、工业测量等多种应用场景。▲长按添加小助理微信:cv3d007 或者 13451707958,咨询更多。本产品提供的SDK和使用教程较为完善,使用起来非常方便。2.2 SD-M系列-线激光(无惧室外场景)KW系列3D相机-适用于机械臂抓取、测量场景。KW-Lumos-W!SD系列3D相机主要适用焊接领域。焊接相机,可户外使用。适用于机械臂抓取、测量。KW-Lumos-W!KW系列3D相机重建效果展示。2.1 KW系列-面结构光。
2026-05-15 07:02:10
61
转载 还在用高斯牛顿法?看看有全局最优保证的求解器!
本报告将系统回顾我们在全局求解器领域的最新研究进展:从特定任务的经典凸松弛优化,到通用的神经同伦优化算法。首先,针对曼哈顿世界下的灭点估计任务,我们首次引入凸松弛技术与“截断多选误差”,实现了关联匹配与位置估计的高效、鲁棒联合求解(该工作获CVPR 2025最佳论文提名)。其次,为打破传统同伦算法严重依赖人工设计启发式规则的局限,我们将引入了神经预测-校正器(NPC)框架。最后,结合我们最新的领域综述,本报告将探讨如何将数据驱动先验与可证明优化深度融合,以构建真正值得信赖的视觉感知系统。
2026-05-14 07:03:49
48
转载 机器人之眼大洗牌:dToF凭什么成为3D感知新王者?
专为移动机器人设计的全固态小体积RGB-D相机,仅90×25×25mm / 90g,0.1-6米(室外)/ 10米(室内)测距,最高1cm精度,支持网口/USB/MIPI三种接口,清洁机器人、AGV/AMR、服务机器人的理想选择。dToF三维相机可实时获取周围环境的三维信息和RGB纹理信息,感知低矮、悬空障碍物,结合语义识别算法,不仅可识别障碍物的位置和大小,还能理解其类型(人、货架、墙体等)。深度感知技术的选择,本质上是应用场景、精度需求、成本预算三者之间的权衡。距离越远,视差越小。
2026-05-14 07:03:49
159
转载 AI+光谱重塑感知边界,构筑全谱智能感知生态
拉曼光谱、近红外光谱、傅里叶变换红外光谱、荧光光谱、太赫兹光谱等各类技术,早已在成分定量分析、分子指纹识别、反应过程监控等场景中发挥着不可替代的作用。部分参展企业包括彩谱科技、高谱科技、光寻智能、光芯智谱、优尼科、多谱光学、吉林求是、巨哥科技、辰昶仪器、中达瑞和、西湖智能视觉、大恒图像、埃科光电、Specim、滨松、StellarNet、鹿起科技、虹科电子、微控光电、乐成光电、研润光机、米铱、光引科技、光达创新、和光微电子、升谱光电、鹭工精密、善测科技、朗思传感、瑞立柯、三晖光电、康冠世纪等。
2026-05-13 07:03:48
126
原创 自动驾驶大一统!HERMES++:集成3D场景理解和未来几何预测,统一驾驶世界模型
点击下方卡片,关注「3D视觉工坊」公众号选择星标,干货第一时间送达本文经作者授权发布 | 来源:3D视觉工坊「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内有20多门3D视觉系统课程、3DGS独家系列视频教程、顶会论文最新解读、海量3D视觉行业源码、项目承接、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎加入!标题:作者:机构:论文:代码:驾驶场景模型通过模拟环境动态,成为实现自动驾驶的关键技术。然而,现有方法大多侧重于未来场景的生成,而忽视了对3D场景的全面理解。另一方面,虽然大型语言模型具备
2026-05-13 07:03:48
529
转载 28倍加速!北大新作Spark3R:无需训练,加速前馈3D重建模型,兼容VGGT、π3 、DepthAnythingV3!
最近出现的令牌合并技术通过压缩全局注意力层中的令牌序列来提升模型效率,但该技术对查询令牌和键值令牌采用统一的压缩方式,而忽略了它们在3D重建过程中所扮演的不同角色。现有令牌合并方法所采用的联合统一压缩策略,其曲线最为陡峭:它继承了查询令牌的全部敏感性,却未能利用键值令牌的高度可压缩性。我们证明了由此产生的框架 Spark3R 可以直接集成到 VGGT、π³ 和 Depth-Anything-3 中,无需重新训练,在 1000 帧的输入上可实现高达 28 倍的加速,同时保持有竞争力的重建质量。
2026-05-12 07:03:51
124
转载 从点云到语义网格:三维重建下半场,可编辑地图已成主战场
知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。,作为补充拓展内容,聚焦行业新技术、热点方向,供大家延伸参考。
2026-05-10 00:01:44
101
转载 精度不再至上!SLAM 终极形态:可编辑 + 实时 + 强鲁棒
知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。
2026-05-09 07:02:37
123
转载 不训练、不调参!DINOv2加持PatchEAD+:对齐&掩码双增强,工业缺陷检测AUC 飙至97.0%!
我们的实验表明,尽管没有文本特征,但与以往的工作相比,我们的方法在少样本和批量零样本性能方面表现更优。重要的是,我们的框架与骨干网络无关,能够无缝集成任何预训练的视觉编码器,使其能够立即部署,并且在各种工业场景中具有高度可扩展性,为稳健的现实世界异常检测提供了切实可行的解决方案。:将查询图像和正常图像编码为特征嵌入,通过计算查询补丁与正常图像补丁的余弦距离,选择最大距离作为每个正常图像的距离得分,聚合得分最高的前若干个图像的得分作为补丁级异常分数,再对前若干个补丁分数求平均得到图像级分数。
2026-05-09 07:02:37
102
转载 SIGGRAPH‘26 | 英伟达新作ArtiFixer:革新3D重建,自回归扩散让PSNR暴涨3 dB!
我们不将重建和生成视为独立的替代方案,而是旨在结合它们互补的优势:生成模型作为强大的先验来修复和完善不完美的重建,而显式(尽管带有噪声且不完整)的3D表示提供了强大的条件信号,为生成提供基础,减轻长期漂移,并抑制幻觉。那些通过连接或交叉注意力在退化渲染上条件化生成的方法存在改变观察到的场景内容的风险,而那些被训练为直接将退化渲染映射到干净图像的方法则无法合成缺失的内容,因为在完全未观察的区域(所有输入像素均为黑色)会出现模式坍塌。而我们的方法即便在初始渲染效果很差的情况下,也能重建出既合理又连贯的图像。
2026-05-08 07:02:27
112
转载 SIGGRAPH‘26 | 英伟达新作ArtiFixer:革新3D重建,自回归扩散让PSNR暴涨3 dB!
我们不将重建和生成视为独立的替代方案,而是旨在结合它们互补的优势:生成模型作为强大的先验来修复和完善不完美的重建,而显式(尽管带有噪声且不完整)的3D表示提供了强大的条件信号,为生成提供基础,减轻长期漂移,并抑制幻觉。那些通过连接或交叉注意力在退化渲染上条件化生成的方法存在改变观察到的场景内容的风险,而那些被训练为直接将退化渲染映射到干净图像的方法则无法合成缺失的内容,因为在完全未观察的区域(所有输入像素均为黑色)会出现模式坍塌。而我们的方法即便在初始渲染效果很差的情况下,也能重建出既合理又连贯的图像。
2026-05-08 07:02:27
75
转载 SIGGRAPH‘26 | 英伟达新作ArtiFixer:革新3D重建,自回归扩散让PSNR暴涨3 dB!
我们不将重建和生成视为独立的替代方案,而是旨在结合它们互补的优势:生成模型作为强大的先验来修复和完善不完美的重建,而显式(尽管带有噪声且不完整)的3D表示提供了强大的条件信号,为生成提供基础,减轻长期漂移,并抑制幻觉。那些通过连接或交叉注意力在退化渲染上条件化生成的方法存在改变观察到的场景内容的风险,而那些被训练为直接将退化渲染映射到干净图像的方法则无法合成缺失的内容,因为在完全未观察的区域(所有输入像素均为黑色)会出现模式坍塌。而我们的方法即便在初始渲染效果很差的情况下,也能重建出既合理又连贯的图像。
2026-05-08 07:02:27
58
转载 五一特惠最后一天!所有课程8折!加入星球可立享10门课程免费学习!
3D视觉工坊五一专属课程福利重磅来袭!为回馈新老学员一路支持,本次活动特推出重磅折扣福利,所有课程统一享8折特惠,其中10余门课程加入知识星球可一次性全部购买学习(3D视觉工坊所涉及课程的包括但不限于:工业3D视觉、自动驾驶、SLAM、具身智能、扩散模型、无人机、大模型和3D视觉基础等。上图中的:ROS2、相机标定、线结构光、3D缺陷检测、激光-视觉-IMU-GPS融合SLAM、、模型部署、3D目标检测、深度估计、多传感器融合这。▲长按扫码添加小助理,咨询更多。,除单独购买享8折外,也。
2026-05-07 07:02:23
52
转载 ICLR‘26开源 | 1000+FPS!Mobile-GS:3D高斯泼溅轻量化新范式,首次在移动设备部署!
此外,为了方便在内存受限的移动平台上部署,我们引入了一阶球谐波精馏、神经矢量量化技术和基于贡献的修剪策略,以减少高斯原语的数量并通过神经网络压缩三维高斯表示。我们的移动-GS集成了深度感知的顺序无关渲染、压缩和蒸馏技术,与原始3DGS相比提供可比较的渲染质量,同时将存储需求大幅降低到 4.8MB 并实现 1098FPS 在无界场景中,从而能够在移动设备上高效部署。在推理阶段,与3DGS不同的是,我们提出的方法消除了基于瓦片的渲染和通常需要精确alpha混合的3D高斯排序过程。我们发现排序是主要的性能瓶颈。
2026-05-07 07:02:23
84
转载 ICLR‘26开源 | 1000+FPS!Mobile-GS:3D高斯泼溅轻量化新范式,首次在移动设备部署!
此外,为了方便在内存受限的移动平台上部署,我们引入了一阶球谐波精馏、神经矢量量化技术和基于贡献的修剪策略,以减少高斯原语的数量并通过神经网络压缩三维高斯表示。我们的移动-GS集成了深度感知的顺序无关渲染、压缩和蒸馏技术,与原始3DGS相比提供可比较的渲染质量,同时将存储需求大幅降低到 4.8MB 并实现 1098FPS 在无界场景中,从而能够在移动设备上高效部署。在推理阶段,与3DGS不同的是,我们提出的方法消除了基于瓦片的渲染和通常需要精确alpha混合的3D高斯排序过程。我们发现排序是主要的性能瓶颈。
2026-05-07 07:02:23
66
socket通信技术
2018-01-23
GBK.h QT中显示中文
2018-01-18
socket通信界面程序
2018-01-24
粒子滤波在图像领域的跟踪
2018-04-25
PCL1.8.0+VS2013+Win10 x64的配置教程
2018-05-08
如何在Linux下使用“linuxdeployqt”源码打包发布Qt程序
2022-07-18
ubuntu下基于Clion+QT编写的界面demo,适合入门
2022-07-11
linux下TCP通讯助手
2022-06-30
本demo主要实现ubuntu下实现与PLC以及机械臂之间的TCP网络通讯,并将C++代码编译成可以供C函数直接调用的C库。
2022-06-22
Windows下TCP通讯实战demo及TCP助手
2022-06-03
Linux下的TCP通讯实战demo以及通讯助手下载
2022-06-03
UKF(无迹卡尔曼滤波)
2020-12-03
particle_filter_demo.zip
2020-12-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅