自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6563)
  • 资源 (35)
  • 收藏
  • 关注

转载 从点云到语义网格:三维重建下半场,可编辑地图已成主战场

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。,作为补充拓展内容,聚焦行业新技术、热点方向,供大家延伸参考。

2026-05-10 00:01:44 6

转载 精度不再至上!SLAM 终极形态:可编辑 + 实时 + 强鲁棒

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。

2026-05-09 07:02:37 9

转载 SIGGRAPH‘26 | 英伟达新作ArtiFixer:革新3D重建,自回归扩散让PSNR暴涨3 dB!

我们不将重建和生成视为独立的替代方案,而是旨在结合它们互补的优势:生成模型作为强大的先验来修复和完善不完美的重建,而显式(尽管带有噪声且不完整)的3D表示提供了强大的条件信号,为生成提供基础,减轻长期漂移,并抑制幻觉。那些通过连接或交叉注意力在退化渲染上条件化生成的方法存在改变观察到的场景内容的风险,而那些被训练为直接将退化渲染映射到干净图像的方法则无法合成缺失的内容,因为在完全未观察的区域(所有输入像素均为黑色)会出现模式坍塌。而我们的方法即便在初始渲染效果很差的情况下,也能重建出既合理又连贯的图像。

2026-05-08 07:02:27 6

转载 SIGGRAPH‘26 | 英伟达新作ArtiFixer:革新3D重建,自回归扩散让PSNR暴涨3 dB!

我们不将重建和生成视为独立的替代方案,而是旨在结合它们互补的优势:生成模型作为强大的先验来修复和完善不完美的重建,而显式(尽管带有噪声且不完整)的3D表示提供了强大的条件信号,为生成提供基础,减轻长期漂移,并抑制幻觉。那些通过连接或交叉注意力在退化渲染上条件化生成的方法存在改变观察到的场景内容的风险,而那些被训练为直接将退化渲染映射到干净图像的方法则无法合成缺失的内容,因为在完全未观察的区域(所有输入像素均为黑色)会出现模式坍塌。而我们的方法即便在初始渲染效果很差的情况下,也能重建出既合理又连贯的图像。

2026-05-08 07:02:27 4

转载 五一特惠最后一天!所有课程8折!加入星球可立享10门课程免费学习!

3D视觉工坊五一专属课程福利重磅来袭!为回馈新老学员一路支持,本次活动特推出重磅折扣福利,所有课程统一享8折特惠,其中10余门课程加入知识星球可一次性全部购买学习(3D视觉工坊所涉及课程的包括但不限于:工业3D视觉、自动驾驶、SLAM、具身智能、扩散模型、无人机、大模型和3D视觉基础等。上图中的:ROS2、相机标定、线结构光、3D缺陷检测、激光-视觉-IMU-GPS融合SLAM、、模型部署、3D目标检测、深度估计、多传感器融合这。▲长按扫码添加小助理,咨询更多。,除单独购买享8折外,也。

2026-05-07 07:02:23 11

转载 ICLR‘26开源 | 1000+FPS!Mobile-GS:3D高斯泼溅轻量化新范式,首次在移动设备部署!

此外,为了方便在内存受限的移动平台上部署,我们引入了一阶球谐波精馏、神经矢量量化技术和基于贡献的修剪策略,以减少高斯原语的数量并通过神经网络压缩三维高斯表示。我们的移动-GS集成了深度感知的顺序无关渲染、压缩和蒸馏技术,与原始3DGS相比提供可比较的渲染质量,同时将存储需求大幅降低到 4.8MB 并实现 1098FPS 在无界场景中,从而能够在移动设备上高效部署。在推理阶段,与3DGS不同的是,我们提出的方法消除了基于瓦片的渲染和通常需要精确alpha混合的3D高斯排序过程。我们发现排序是主要的性能瓶颈。

2026-05-07 07:02:23 6

原创 CVPR‘26 Highlight | ParticleGS:首个物理驱动4DGS预测新范式,通向4D世界模型!

这种“轨迹拟合”式的方法虽然在观测时间内表现优异,却因缺乏对底层物理规律的理解,在预测未来(运动外推)时极易出现物理上不合理的崩坏。研究团队从物质点法(MPM)中汲取灵感,将N个高斯粒子的物理状态巧妙地解耦为两部分:每个粒子的时间不变的“静态属性”(如质量、材质)以及全局粒子共享的F个“系统级动态场”(如引力场、风场)。该框架实现了在无需人工设定繁琐的先验假设或几何网格的情况下,直接从RGB视频中学习3D高斯粒子的神经动力学,实现了极其稳定、符合物理直觉的未来运动外推。关键在于对“时间”的理解。

2026-05-06 07:03:27 288

原创 CVPR‘26 Highlight | ParticleGS:首个物理驱动4DGS预测新范式,通向4D世界模型!

这种“轨迹拟合”式的方法虽然在观测时间内表现优异,却因缺乏对底层物理规律的理解,在预测未来(运动外推)时极易出现物理上不合理的崩坏。研究团队从物质点法(MPM)中汲取灵感,将N个高斯粒子的物理状态巧妙地解耦为两部分:每个粒子的时间不变的“静态属性”(如质量、材质)以及全局粒子共享的F个“系统级动态场”(如引力场、风场)。该框架实现了在无需人工设定繁琐的先验假设或几何网格的情况下,直接从RGB视频中学习3D高斯粒子的神经动力学,实现了极其稳定、符合物理直觉的未来运动外推。关键在于对“时间”的理解。

2026-05-06 07:03:27 313

转载 语义SLAM全面崛起,纯几何方案为何加速掉队?

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。

2026-05-05 00:01:32 34

转载 三位一体融合:SLAM+3D重建+世界模型,重构空间智能下一代底座

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。

2026-05-04 00:01:11 37

转载 SLAM+3D重建+世界模型,重构空间智能下一代底座!

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。

2026-05-04 00:01:11 24

转载 3DGS之后,谁在重构SLAM的技术底盘?顶会已给出答案

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。3D视觉包含立体视觉、结构光和TOF,以立体视觉为主。

2026-05-03 00:01:21 52

转载 4D动态重建正面交锋,流式建图凭什么完成破局?

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。凭它更懂真实世界的需求,更贴合商业化落地的逻辑,更早一步走进大众生活。

2026-05-01 00:01:28 43

原创 CVPR‘26 Highlight 开源 | 清华SimRecon:高保真组合式场景重建,打通「感知-生成-模拟」全流程

具体来说,在“感知”到“生成”的转换过程中,为确保视觉效果的真实性,我们采用了“主动视角优化”技术,该技术能在三维空间中寻找最佳的投影图像,作为生成单个物体的依据。此外,我们的框架利用合成的场景图来指导基于物理的资产组装,确保最终配置的物理合理性,不会出现悬浮或穿透的情况。具体来说,为了弥合从感知到生成的鸿沟,这需要将非结构化和杂乱的三维几何表示转换为生成模型的有效图像条件,我们引入了主动视点优化,它在三维场景中智能搜索具有最大信息增益的最优视角作为最佳视点条件。我们的方法SimRecon的整体框架。

2026-04-30 08:59:26 398

原创 CVPR‘26 Highlight 开源 | 清华SimRecon:高保真组合式场景重建,打通「感知-生成-模拟」全流程

具体来说,在“感知”到“生成”的转换过程中,为确保视觉效果的真实性,我们采用了“主动视角优化”技术,该技术能在三维空间中寻找最佳的投影图像,作为生成单个物体的依据。此外,我们的框架利用合成的场景图来指导基于物理的资产组装,确保最终配置的物理合理性,不会出现悬浮或穿透的情况。具体来说,为了弥合从感知到生成的鸿沟,这需要将非结构化和杂乱的三维几何表示转换为生成模型的有效图像条件,我们引入了主动视点优化,它在三维场景中智能搜索具有最大信息增益的最优视角作为最佳视点条件。我们的方法SimRecon的整体框架。

2026-04-30 08:59:26 273

原创 CVPR‘26 Highlight 开源 | 清华SimRecon:高保真组合式场景重建,打通「感知-生成-模拟」全流程

具体来说,在“感知”到“生成”的转换过程中,为确保视觉效果的真实性,我们采用了“主动视角优化”技术,该技术能在三维空间中寻找最佳的投影图像,作为生成单个物体的依据。此外,我们的框架利用合成的场景图来指导基于物理的资产组装,确保最终配置的物理合理性,不会出现悬浮或穿透的情况。具体来说,为了弥合从感知到生成的鸿沟,这需要将非结构化和杂乱的三维几何表示转换为生成模型的有效图像条件,我们引入了主动视点优化,它在三维场景中智能搜索具有最大信息增益的最优视角作为最佳视点条件。我们的方法SimRecon的整体框架。

2026-04-30 08:59:26 303

原创 CVPR‘26 Highlight 开源 | 清华SimRecon:高保真组合式场景重建,打通「感知-生成-模拟」全流程

具体来说,在“感知”到“生成”的转换过程中,为确保视觉效果的真实性,我们采用了“主动视角优化”技术,该技术能在三维空间中寻找最佳的投影图像,作为生成单个物体的依据。此外,我们的框架利用合成的场景图来指导基于物理的资产组装,确保最终配置的物理合理性,不会出现悬浮或穿透的情况。具体来说,为了弥合从感知到生成的鸿沟,这需要将非结构化和杂乱的三维几何表示转换为生成模型的有效图像条件,我们引入了主动视点优化,它在三维场景中智能搜索具有最大信息增益的最优视角作为最佳视点条件。我们的方法SimRecon的整体框架。

2026-04-30 08:59:26 508

原创 CVPR‘26 Highlight 开源 | 清华SimRecon:高保真组合式场景重建,打通「感知-生成-模拟」全流程

具体来说,在“感知”到“生成”的转换过程中,为确保视觉效果的真实性,我们采用了“主动视角优化”技术,该技术能在三维空间中寻找最佳的投影图像,作为生成单个物体的依据。此外,我们的框架利用合成的场景图来指导基于物理的资产组装,确保最终配置的物理合理性,不会出现悬浮或穿透的情况。具体来说,为了弥合从感知到生成的鸿沟,这需要将非结构化和杂乱的三维几何表示转换为生成模型的有效图像条件,我们引入了主动视点优化,它在三维场景中智能搜索具有最大信息增益的最优视角作为最佳视点条件。我们的方法SimRecon的整体框架。

2026-04-30 08:59:26 400

转载 CVPR‘26 | 雷达+相机多模态融合新SOTA

逐步消融研究验证了各组件的有效性,简单特征拼接可改善时间一致性,可变形对齐增强运动感知融合,引入门控机制增益最大,Squeeze - and - Excitation 无额外益处,DGTF 增强了 BEV 定位和 3D 检测性能,且使用最近的前一帧融合效果最佳。:对于解码后的预期深度图 d_hat,结合稀疏雷达锚定深度和密集伪地面真值(Metric3D) dg_dense 作为监督,应用平滑 L1 损失,防止潜在雷达离群值导致的梯度爆炸,通过损失函数确保关键点的高精度和全场景的结构覆盖。

2026-04-29 07:02:51 12

转载 CVPR‘26 | 雷达+相机多模态融合新SOTA

逐步消融研究验证了各组件的有效性,简单特征拼接可改善时间一致性,可变形对齐增强运动感知融合,引入门控机制增益最大,Squeeze - and - Excitation 无额外益处,DGTF 增强了 BEV 定位和 3D 检测性能,且使用最近的前一帧融合效果最佳。:对于解码后的预期深度图 d_hat,结合稀疏雷达锚定深度和密集伪地面真值(Metric3D) dg_dense 作为监督,应用平滑 L1 损失,防止潜在雷达离群值导致的梯度爆炸,通过损失函数确保关键点的高精度和全场景的结构覆盖。

2026-04-29 07:02:51 10

转载 CVPR‘26 | 雷达+相机多模态融合新SOTA

逐步消融研究验证了各组件的有效性,简单特征拼接可改善时间一致性,可变形对齐增强运动感知融合,引入门控机制增益最大,Squeeze - and - Excitation 无额外益处,DGTF 增强了 BEV 定位和 3D 检测性能,且使用最近的前一帧融合效果最佳。:对于解码后的预期深度图 d_hat,结合稀疏雷达锚定深度和密集伪地面真值(Metric3D) dg_dense 作为监督,应用平滑 L1 损失,防止潜在雷达离群值导致的梯度爆炸,通过损失函数确保关键点的高精度和全场景的结构覆盖。

2026-04-29 07:02:51 7

转载 CVPR‘26 | 雷达+相机多模态融合新SOTA

逐步消融研究验证了各组件的有效性,简单特征拼接可改善时间一致性,可变形对齐增强运动感知融合,引入门控机制增益最大,Squeeze - and - Excitation 无额外益处,DGTF 增强了 BEV 定位和 3D 检测性能,且使用最近的前一帧融合效果最佳。:对于解码后的预期深度图 d_hat,结合稀疏雷达锚定深度和密集伪地面真值(Metric3D) dg_dense 作为监督,应用平滑 L1 损失,防止潜在雷达离群值导致的梯度爆炸,通过损失函数确保关键点的高精度和全场景的结构覆盖。

2026-04-29 07:02:51 17

转载 CVPR‘26 | 雷达+相机多模态融合新SOTA

逐步消融研究验证了各组件的有效性,简单特征拼接可改善时间一致性,可变形对齐增强运动感知融合,引入门控机制增益最大,Squeeze - and - Excitation 无额外益处,DGTF 增强了 BEV 定位和 3D 检测性能,且使用最近的前一帧融合效果最佳。:对于解码后的预期深度图 d_hat,结合稀疏雷达锚定深度和密集伪地面真值(Metric3D) dg_dense 作为监督,应用平滑 L1 损失,防止潜在雷达离群值导致的梯度爆炸,通过损失函数确保关键点的高精度和全场景的结构覆盖。

2026-04-29 07:02:51 12

转载 CVPR‘26 | 雷达+相机多模态融合新SOTA

逐步消融研究验证了各组件的有效性,简单特征拼接可改善时间一致性,可变形对齐增强运动感知融合,引入门控机制增益最大,Squeeze - and - Excitation 无额外益处,DGTF 增强了 BEV 定位和 3D 检测性能,且使用最近的前一帧融合效果最佳。:对于解码后的预期深度图 d_hat,结合稀疏雷达锚定深度和密集伪地面真值(Metric3D) dg_dense 作为监督,应用平滑 L1 损失,防止潜在雷达离群值导致的梯度爆炸,通过损失函数确保关键点的高精度和全场景的结构覆盖。

2026-04-29 07:02:51 8

转载 CVPR‘26 Highlight开源 | VGGT并非全能?Dark3R:低光照条件下鲁棒的特征匹配和相机姿态估计!

为了训练和评估Dark3R,我们引入了一个全新的、首创的数据集,包含约42,000张具有精确3D标注的多视角、包围曝光的原始图像,以及另外约20,000张涵盖近100个不同场景的高信噪比多视角原始图像。使用这个数据集,我们证明了Dark3R能够在先前方法失败的地方实现准确的相机姿态和深度估计——因此,我们的工作为被动式3D传感的新应用开辟了弱光环境。我们绘制了所有四个场景和包围曝光捕获的平均PSNR与图像信噪比的关系图,这表明随着信噪比的降低,我们的方法实现了持续较低的姿态和深度误差以及较高的重建质量。

2026-04-28 07:04:04 35

转载 CVPR‘26 Highlight开源 | VGGT并非全能?Dark3R:低光照条件下鲁棒的特征匹配和相机姿态估计!

为了训练和评估Dark3R,我们引入了一个全新的、首创的数据集,包含约42,000张具有精确3D标注的多视角、包围曝光的原始图像,以及另外约20,000张涵盖近100个不同场景的高信噪比多视角原始图像。使用这个数据集,我们证明了Dark3R能够在先前方法失败的地方实现准确的相机姿态和深度估计——因此,我们的工作为被动式3D传感的新应用开辟了弱光环境。我们绘制了所有四个场景和包围曝光捕获的平均PSNR与图像信噪比的关系图,这表明随着信噪比的降低,我们的方法实现了持续较低的姿态和深度误差以及较高的重建质量。

2026-04-28 07:04:04 12

转载 CVPR‘26 Highlight开源 | VGGT并非全能?Dark3R:低光照条件下鲁棒的特征匹配和相机姿态估计!

为了训练和评估Dark3R,我们引入了一个全新的、首创的数据集,包含约42,000张具有精确3D标注的多视角、包围曝光的原始图像,以及另外约20,000张涵盖近100个不同场景的高信噪比多视角原始图像。使用这个数据集,我们证明了Dark3R能够在先前方法失败的地方实现准确的相机姿态和深度估计——因此,我们的工作为被动式3D传感的新应用开辟了弱光环境。我们绘制了所有四个场景和包围曝光捕获的平均PSNR与图像信噪比的关系图,这表明随着信噪比的降低,我们的方法实现了持续较低的姿态和深度误差以及较高的重建质量。

2026-04-28 07:04:04 105

转载 CVPR‘26 Highlight开源 | VGGT并非全能?Dark3R:低光照条件下鲁棒的特征匹配和相机姿态估计!

为了训练和评估Dark3R,我们引入了一个全新的、首创的数据集,包含约42,000张具有精确3D标注的多视角、包围曝光的原始图像,以及另外约20,000张涵盖近100个不同场景的高信噪比多视角原始图像。使用这个数据集,我们证明了Dark3R能够在先前方法失败的地方实现准确的相机姿态和深度估计——因此,我们的工作为被动式3D传感的新应用开辟了弱光环境。我们绘制了所有四个场景和包围曝光捕获的平均PSNR与图像信噪比的关系图,这表明随着信噪比的降低,我们的方法实现了持续较低的姿态和深度误差以及较高的重建质量。

2026-04-28 07:04:04 11

转载 CVPR‘26 Highlight开源 | VGGT并非全能?Dark3R:低光照条件下鲁棒的特征匹配和相机姿态估计!

为了训练和评估Dark3R,我们引入了一个全新的、首创的数据集,包含约42,000张具有精确3D标注的多视角、包围曝光的原始图像,以及另外约20,000张涵盖近100个不同场景的高信噪比多视角原始图像。使用这个数据集,我们证明了Dark3R能够在先前方法失败的地方实现准确的相机姿态和深度估计——因此,我们的工作为被动式3D传感的新应用开辟了弱光环境。我们绘制了所有四个场景和包围曝光捕获的平均PSNR与图像信噪比的关系图,这表明随着信噪比的降低,我们的方法实现了持续较低的姿态和深度误差以及较高的重建质量。

2026-04-28 07:04:04 12

转载 CVPR‘26开源 | SwiftVGGT:大规模3D场景重建的可扩展VGGT,4分钟跑完4542张图像!

本文中,我们提出了SwiftVGGT,一种无需训练的方法,能够在不增加额外内存成本的情况下显著加速大规模稠密重建的推理,同时保持甚至提高重建质量。我们的方法包含两个关键组成部分。如表2所示,现有的基于三维视觉基础模型的方法,如MASt3R-SLAM、CUT3R、Fast3R和FastVGGT,由于内存使用过多,通常无法处理长序列,导致跟踪丢失或内存不足错误。其次,VGGT-Long通过运行一个独立的、基于DINO的VPR编码器来检测闭环,该编码器与VGGT内部的DINO编码器分离,引入了额外的计算负担。

2026-04-27 07:02:52 27

转载 CVPR‘26开源 | SwiftVGGT:大规模3D场景重建的可扩展VGGT,4分钟跑完4542张图像!

本文中,我们提出了SwiftVGGT,一种无需训练的方法,能够在不增加额外内存成本的情况下显著加速大规模稠密重建的推理,同时保持甚至提高重建质量。我们的方法包含两个关键组成部分。如表2所示,现有的基于三维视觉基础模型的方法,如MASt3R-SLAM、CUT3R、Fast3R和FastVGGT,由于内存使用过多,通常无法处理长序列,导致跟踪丢失或内存不足错误。其次,VGGT-Long通过运行一个独立的、基于DINO的VPR编码器来检测闭环,该编码器与VGGT内部的DINO编码器分离,引入了额外的计算负担。

2026-04-27 07:02:52 31

转载 CVPR‘26开源 | SwiftVGGT:大规模3D场景重建的可扩展VGGT,4分钟跑完4542张图像!

本文中,我们提出了SwiftVGGT,一种无需训练的方法,能够在不增加额外内存成本的情况下显著加速大规模稠密重建的推理,同时保持甚至提高重建质量。我们的方法包含两个关键组成部分。如表2所示,现有的基于三维视觉基础模型的方法,如MASt3R-SLAM、CUT3R、Fast3R和FastVGGT,由于内存使用过多,通常无法处理长序列,导致跟踪丢失或内存不足错误。其次,VGGT-Long通过运行一个独立的、基于DINO的VPR编码器来检测闭环,该编码器与VGGT内部的DINO编码器分离,引入了额外的计算负担。

2026-04-27 07:02:52 11

转载 CVPR‘26开源 | SwiftVGGT:大规模3D场景重建的可扩展VGGT,4分钟跑完4542张图像!

本文中,我们提出了SwiftVGGT,一种无需训练的方法,能够在不增加额外内存成本的情况下显著加速大规模稠密重建的推理,同时保持甚至提高重建质量。我们的方法包含两个关键组成部分。如表2所示,现有的基于三维视觉基础模型的方法,如MASt3R-SLAM、CUT3R、Fast3R和FastVGGT,由于内存使用过多,通常无法处理长序列,导致跟踪丢失或内存不足错误。其次,VGGT-Long通过运行一个独立的、基于DINO的VPR编码器来检测闭环,该编码器与VGGT内部的DINO编码器分离,引入了额外的计算负担。

2026-04-27 07:02:52 25

转载 CVPR‘26开源 | SwiftVGGT:大规模3D场景重建的可扩展VGGT,4分钟跑完4542张图像!

本文中,我们提出了SwiftVGGT,一种无需训练的方法,能够在不增加额外内存成本的情况下显著加速大规模稠密重建的推理,同时保持甚至提高重建质量。我们的方法包含两个关键组成部分。如表2所示,现有的基于三维视觉基础模型的方法,如MASt3R-SLAM、CUT3R、Fast3R和FastVGGT,由于内存使用过多,通常无法处理长序列,导致跟踪丢失或内存不足错误。其次,VGGT-Long通过运行一个独立的、基于DINO的VPR编码器来检测闭环,该编码器与VGGT内部的DINO编码器分离,引入了额外的计算负担。

2026-04-27 07:02:52 12

转载 三维重建中SfM/MVS与NeRF/3DGS的核心区别:一文看懂底层逻辑

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。学习3D视觉核心技术,扫码即可加入,近20+门3D视觉精品课程畅学无阻。

2026-04-26 00:01:47 67

转载 Spark 2.0 开源之后:三维重建的技术终局,已经定了!

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。的闭环,在精度、速度、规模、工程化与生态上全面领先,没有任何其他技术路线可与之抗衡,

2026-04-25 00:01:36 58

转载 Spark 2.0 开源之后:三维重建的技术终局,真的定了?

知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享3D视觉最新顶会论文&代码资料、分享视频(讲解3D视觉重要知识点)、发布高质量的求职就业信息,承接项目等,当然还可以侃侃而谈,吐槽学习工作生活。细分方向众多,包括但不限于:工业3D视觉、三维重建、自动驾驶、具身智能、大模型、扩散模型等科技前沿方向,也涉及视觉竞赛、硬件选型、视觉产品落地经验分享、学术&求职交流等。的闭环,在精度、速度、规模、工程化与生态上全面领先,没有任何其他技术路线可与之抗衡,

2026-04-25 00:01:36 38

转载 CVPR‘26 Oral | MAGICIAN:让Agents也有想象力,主动探索新SOTA

该方法通过利用预训练的3d world model生成“Imagined Gaussians”(一种快速的体素化场景结构表示),结合树搜索进行多步规划,从而确定最优的探索路径。借助其基于先验的内部模拟机制,系统能够在不执行真实动作的情况下评估多种潜在结果,从而做出更具前瞻性的选择。MAGICIAN 通过表明在采用合适表示的前提下,高效的长时规划是可行的,从而推动了主动建图领域的发展。在图中,Imagined Gaussians 中较浅的颜色表示更高的新颖性,而较深的颜色对应已经观测过的区域。

2026-04-25 00:01:36 30

转载 CVPR‘26 Oral | MAGICIAN:让Agents也有想象力,主动探索新SOTA

该方法通过利用预训练的3d world model生成“Imagined Gaussians”(一种快速的体素化场景结构表示),结合树搜索进行多步规划,从而确定最优的探索路径。借助其基于先验的内部模拟机制,系统能够在不执行真实动作的情况下评估多种潜在结果,从而做出更具前瞻性的选择。MAGICIAN 通过表明在采用合适表示的前提下,高效的长时规划是可行的,从而推动了主动建图领域的发展。在图中,Imagined Gaussians 中较浅的颜色表示更高的新颖性,而较深的颜色对应已经观测过的区域。

2026-04-25 00:01:36 23

转载 CVPR‘26 Oral | MAGICIAN:让Agents也有想象力,主动探索新SOTA

该方法通过利用预训练的3d world model生成“Imagined Gaussians”(一种快速的体素化场景结构表示),结合树搜索进行多步规划,从而确定最优的探索路径。借助其基于先验的内部模拟机制,系统能够在不执行真实动作的情况下评估多种潜在结果,从而做出更具前瞻性的选择。MAGICIAN 通过表明在采用合适表示的前提下,高效的长时规划是可行的,从而推动了主动建图领域的发展。在图中,Imagined Gaussians 中较浅的颜色表示更高的新颖性,而较深的颜色对应已经观测过的区域。

2026-04-25 00:01:36 30

卡尔曼滤波示例程序

这是我在研究卡尔曼滤波以及粒子滤波时,封装好的卡尔曼滤波跟踪二维点的程序。程序中已经有测试好的点击,配置好opencv属性表,便可以直接运行。

2018-04-25

相机最佳曝光时间的确定

由于每次使用相机时,需要调试相机的曝光时间,比较耽误时间,因而封装了一个函数,可以用来确定相机最佳的曝光时间。

2017-12-21

Particle滤波 粒子滤波跟踪算法

粒子滤波跟踪算法,我已成功运用于光笔的动态跟踪,现上传,希望可以帮助到大家。

2017-08-22

利用PointGrey相机连续拍照

此程序可以用来给PointGrey通过程序拍照,并且拍完的照片可以连续保存到指定的文件夹下。

2017-05-13

socket通信技术

1、 程序:socket_Send为发送端; 程序:socket_Receive为接收端; 2、 此程序可以用来接收和发送txt,jpg.avi等各种文件和char类型的数据; 如果对于结构体,可以先将其转化成char,再发送,接收之后,再转化成结构体。 可以参考我知乎提供的方法。

2018-01-23

GBK.h QT中显示中文

只要包含该头文件在QT工程中, QString imgPath = QFileDialog::getExistingDirectory(this, GBK::ToUnicode("设置图像 打开路径"), "D:/ImgFiles/", QFileDialog::Option::ShowDirsOnly); 如这条语句中用法,便可显示中文。

2018-01-18

XML头文件与cpp函数

此为XML文件读写的函数头文件与cpp文件,在项目中添加进来即可。

2018-01-26

qt data visualization 5.7.1 源码

这是我在QT官网上下载的qt data viualization的源码,可以使用Cmake成功编译。

2017-12-19

XML文件读写程序C++

XML文件读写封装好的程序,可以加入到工程中直接使用。

2017-12-21

串口程序 可以自动识别串口号

可以用来自动识别串口号,方便快捷,成功应用于ZigBee板子中。

2017-05-13

配置VS2013+Qt5开发环境续:安装和设置以及QT工程创建

该资源为VS2013+QT5开发环境的安装配置以及Qt的工程创建。

2018-01-08

串口自动识别

Com端自动识别函数的封装,经过测试,亲测有效,可以自动识别串口号。

2017-12-21

相机拍照程序(PointGrey相机)

资源中是我经常使用的PointGrey相机的拍照程序,实现了可以使用软触发和硬触发拍照。

2017-12-21

QGraphicsView类的简单用法

QT 控件QGraphicsView的简单用法,包含头文件和cpp,函数调用参考README.txt

2018-01-18

socket通信界面程序

1、发送端为利用PointGrey相机追踪编码点并将其坐标值传输给接收端; 2、接收端为使用Qt Data Visualizaiton库编写的三维点显示界面。

2018-01-24

xml读写项目总结

里面包括:1、封装好的XML文件的读和写工程;2、tinyxml库;3、xmlPPT讲解。

2018-01-26

粒子滤波在图像领域的跟踪

粒子滤波在非高斯、非线性状况下,运动情况由于卡尔曼滤波。这是我在研究粒子滤波时,封装好的测试程序。下载之后,只需要将opencv属性表添加进来,便可以观看到运行效果图。

2018-04-25

socket通信

socket通信实现代码,已经成功测试。可以运用于QT以及MFC。

2018-01-08

QT在VS2013中的配置

该文档为QT5.7.1在VS2013中详细的配置教程,文章中对于配置过程中必要的软件安装包下载链接皆已提供。

2018-05-08

VS2013+OpenCV3.1.0配置教程

该文档为OpenCV3.1.0在VS2013中详细的配置教程,包括相关安装包的下载链接。

2018-05-08

PCL1.8.0+VS2013+Win10 x64的配置教程

本篇文章主要介绍一下PCL库的配置过程,适合PCL入门。 一配置环境 1.win10 X64 2.Visual Studio 2013

2018-05-08

支持linux下像素级查看图片

支持linux下像素级查看图片

2023-01-29

Ymodem串口升级界面及源码(linux下也可使用)

Ymodem串口升级界面及源码(QT)

2022-07-20

如何在Linux下使用“linuxdeployqt”源码打包发布Qt程序

使用教程请参考博客:https://yongqi.blog.csdn.net/article/details/125841736

2022-07-18

ubuntu下基于Clion+QT编写的界面demo,适合入门

ubuntu下基于Clion+QT编写的界面demo,适合入门, 博客请参考:https://yongqi.blog.csdn.net/article/details/125698957

2022-07-11

针孔、鱼眼相机标定,包括单目和双目标定demo

针孔、鱼眼相机标定,包括单目和双目标定demo, 基于OpenCV和C++。

2022-07-01

OpenCV3.3.1安装包

用法请参考:https://mp.csdn.net/mp_blog/creation/success/125555489

2022-07-01

linux下TCP通讯助手

里面为deb文件,直接双击即可安装。或者通过指令: sudo dpkg -i **.deb 如果安装后点击软件无反应,则需要在终端执行: sudo apt-get install libqtgui4:amd64

2022-06-30

本demo主要实现ubuntu下实现与PLC以及机械臂之间的TCP网络通讯,并将C++代码编译成可以供C函数直接调用的C库。

本demo主要实现ubuntu下实现与PLC以及机械臂之间的TCP网络通讯,并将C++代码编译成可以供C函数直接调用的C库。

2022-06-22

Windows下TCP通讯实战demo及TCP助手

内容概要: Windows下TCP通讯实战demo,可以直接适用于与EPSON或者三菱等机械臂通讯,包括发送与接收字符串,位姿坐标等,以及两个好用的TCP助手。 适用人群:需要进行网络通讯的场景。

2022-06-03

Linux下的TCP通讯实战demo以及通讯助手下载

内容概要: Linux下的TCP通讯实战demo,以及通讯助手小工具 适用人群: 需要进行TCP网络通讯的问题。 主要适用场景。 通过网线或者wifi进行数据通讯的场景 //注意:在使用tcp/ip通讯时,请将服务器与客户端的ip设为同一个网段。 //本次演示的demo中, //服务器的ip为:192.168.3.8 端口号为8080 //客户端的ip为:192.168.3.48 端口号为36214(可以通过串口助手查看端口号) //以上同一个网段,如何判断两个ip地址是否为同一个网段,可以参考博客:https://baijiahao.baidu.com/s?id=1687382131051003813&wfr=spider&for=pc

2022-06-03

UKF(无迹卡尔曼滤波)

主要封装了UKF(无迹卡尔曼滤波)的跟踪demo,并配有直观的图形展示,简单易用。 UKF,是KF、EKF的变种与扩展,对于非线性跟踪效果要明显好于KF。

2020-12-03

Visual Assistant 2015破解版安装包

详细的安装教程请参见:https://mp.weixin.qq.com/s/_JvR9pWiIvDI7uOQvr1IGA

2018-09-12

Github安装包

Github安装包。点击下载,解压即可轻松安装。便于项目工程管理。

2018-05-12

particle_filter_demo.zip

主要封装了粒子滤波(Particle Filter)对于非线性系统、非高斯噪声系统的跟踪效果,附有数据与图形展示过程,直观易懂。

2020-12-03

精确绘制椭圆

该文件封装好的函数为:1、利用OpenCV函数绘制椭圆;2、利用面积法精确绘制椭圆。替换掉OpenCV属性表,即可成功运行。

2018-05-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除