DUSt3R部署+体验

最新推荐文章于 2025-03-17 10:00:00 发布

半山观云

最新推荐文章于 2025-03-17 10:00:00 发布

阅读量3k

点赞数 9

分类专栏： 3D 文章标签： 3d

本文链接：https://blog.csdn.net/u011833022/article/details/136508467

版权

3D 专栏收录该内容

2 篇文章

订阅专栏

最近新出的DUSt3R在几张图片的情况下，快速输出3D模型，所以来体验下。

简介

DUSt3R，一种用于任意图像集合的密集和无约束立体 3D 重建的全新范例，即在没有有关相机校准或视点姿势的先验信息的情况下进行操作。DUSt3R 使几何 3D 视觉任务变得简单。

说人话，就是传统的相机姿势估计那一套我不用，但是也可以准确找到相机姿势。

部署

官方的部署文档很全也很简单。依次按照操作即可。

注意pytorch的安装需要根据自己的GPU替换命令。命令可在pytorch官网进行下载。

模型下载

官方部署文档页面提供了3个模型，但是下载最后一个模型即可。后续命令默认的模型也是最后一个。

体验

GUI-demo

我尝试运行demo，GUI没有运行起来，也没有报错，不知道什么原因。

python3 demo.py --weights checkpoints/DUSt3R_ViTLarge_BaseDecoder_512_dpt.pth

脚本体验

新增一个test.py，将官方文档的Usage脚本贴进去，替换图片路径。

执行脚本，结果自动弹出：

训练

暂时没有想法进行训练，不做说明。

评价

1、速度确实快

2、效果，没那好，因为是点状的，而且比较稀疏，稍微拉大一点就是点云了，就看不清楚内容了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

半山观云

关注关注

9
点赞
踩
21

收藏

觉得还不错? 一键收藏
10
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

DUSt3R-从任意图像集合中重建3D场景的框架

specssss的博客

03-08

2027

DUSt3R(Dense and Unconstrained Stereo 3D Reconstruction，密集无约束立体三维重建)是由来自芬兰阿尔托大学和Naver欧洲实验室的研究人员推出的一个3D重建框架，旨在简化从任意图像集合中重建三维场景的过程，而无需事先了解相机校准或视点位置的信息。官方项目主页:https://dust3r.europe.naverlabs.com/c。GitHub代码库:https://github.com/naver/dust3re。DUSt3R的官网入口。

【DUSt3R】2张图2秒钟3D重建

格物致知

03-04

2157

在这个过程中，数据的维度会根据不同模块的处理而发生变化，具体变化的维度需要根据具体的网络结构和处理步骤来确定。具体网络架构方面，DUSt3R基于的是标准Transformer编码器和解码器，受到了CroCo（通过跨视图完成3D视觉任务的自我监督预训练的一个研究）的启发，并采用简单的回归损失训练完成。Pointmaps是指一种密集的2D场景中的3D点的表示，通常用符号X表示，其维度为RW×H×3。在提供超过两张输入图像的情况下，通过一种简单而有效的全局对准策略，将所有成对的点图表示为一个共同的参考框架。

10 条评论您还未登录，请先登录后发表或查看评论

Dust3R个人配置成功的requirement.txt

07-16

Dust3R个人配置成功的requirement.txt

CVPR2024:用于野外逼真图像恢复的实用算法

03-11

(CVPR2024) Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild

【论文笔记】MUSt3R：推广DUSt3R+记忆机制

最新发布

m0_74310646的博客

03-17

1654

DUSt3R在几何计算机视觉领域引入了一种新颖的范式，提出了一种能够对任意图像集合进行密集且无约束的立体三维重建的模型，而无需事先了解相机校准或视角姿态信息。然而，DUSt3R在内部处理图像对并且回归局部三维重建，这些重建需要在全局坐标系中对齐。图像对的数量呈二次增长，这一固有限制在大规模图像集合的鲁棒和快速优化中尤为突出。本文提出了一种将DUSt3R从图像对扩展到多视图的扩展方法，解决了上述所有问题。

DUSt3R: Geometric 3D Vision Made Easy 的Pytorch实现

03-04

DUSt3R: Geometric 3D Vision Made Easy 的Pytorch实现交互性演示：在此演示中，您应该能够在计算机上运行 DUSt3R 来重建场景。首先选择描绘相同场景的图像。您可以调整全局对齐计划及其迭代次数。注意：如果您选择了一张或两张图像，则将跳过全局对齐过程（mode = GlobalAlignerMode.PairViewer）点击“运行”并等待。当全局对齐结束时，将出现重建。使用滑块“min_conf_thr”显示或删除低置信度区域。 python3 demo.py --weights checkpoints/DUSt3R_ViTLarge_BaseDecoder_512_dpt.pth

dust3r部署踩坑全记录

xq_nbu的博客

05-29

1725

dust3r部署踩坑全记录

DUSt3R 三维重建：Windows + Pycharm本地安装使用全流程

不太聪明的椰羊的博客

08-04

4557

关于如何在Windows 10系统上，使用PyCharm和Anaconda进行DUSt3R（一个3D重建框架）项目的安装和配置的过程记录。包括了从项目克隆、解决克隆过程中可能遇到的错误、安装CUDA（针对GPU加速）、创建适合的虚拟环境、运行项目等步骤。

Dust3R部署

m0_63967404的博客

12-13

849

部署Dust3R

Python DUSt3R：简化3D几何视觉的Python工具包

weixin_31139479的博客

09-19

1309

本文还有配套的精品资源，点击获取简介：Python_DUSt3R工具包通过提供易用的接口和预定义功能，简化了在Python环境中对三维数据的操作和可视化。它包含基础3D数据结构、空间变换函数，集成可视化库，并支持深度图像处理和点云配准算法，适用于3D重建和SLAM等应用。该压缩包内含核心代码和文档，为开发者提供了快速构建3D场景和处理3D几何数据的能力。 1. ...

三维重建——DUSt3R

主要分享神经形态计算相关内容

03-08

3345

三维重建是指从一系列二维图像或其他传感器数据中恢复三维物体的几何结构和外观信息的过程。三维重建在许多领域中都有应用，包括计算机视觉、计算机图形学、医学影像处理、建筑和文物保护等。它可以用于创建虚拟现实环境、数字化文物、建筑物和城市场景的建模，以及在医学中用于诊断和手术规划等领域。今天星主给大家介绍一下人家最近开源的一项工作——DUSt3R（

DUSt3R: Geometric 3D Vision Made Easy

qq_34426949的博客

07-02

1799

Multi-view stereo reconstruction (MVS) in the wild requires to first estimate the camera parameters e.g. intrinsic and extrinsic parameters. These are usually tedious and cumbersome to obtain, yet they are mandatory to triangulate corresponding pixels in 3

Python_DUSt3R几何3D视觉变得容易.zip

05-24

Python_DUSt3R是一个工具包，旨在简化3D几何视觉的处理，使用户能够更容易地在Python环境中进行三维数据操作和可视化。这个压缩包“Python_DUSt3R几何3D视觉变得容易.zip”包含了实现这一目标的核心代码和相关文档。...

【论文笔记】ZeroGS：扩展Spann3R+GS+pose估计

m0_74310646的博客

02-13

1388

NeRF和3DGS是重建和渲染逼真图像的流行技术。然而，他们需要以SfM作为前提。虽然之前的方法可以从少量无姿态图像中重建，但它们不适用于图像无序或密集采集的情况。在本研究中，我们提出了ZeroGS，用于从数百张无姿态和无序的图像中训练3DGS。我们的方法利用预训练的基础模型作为神经场景表示。由于预测的点图精度不足以支持精确的图像配准和高保真图像渲染，我们提出通过从种子图像初始化和微调预训练模型来缓解这一问题。然后，图像逐步配准并添加到训练缓冲区中，进一步用于训练模型。

论文笔记1-DUSt3R: Geometric 3D Vision Made Easy

weixin_61091146的博客

10-28

1775

采取了相反的立场并引入了 DUSt3R，用于任意图像集合的密集和无约束立体 3D 重建，无需有关相机校准或视点姿势的先验信息即可运行。在提供两个以上图像的情况下，进一步提出了一种简单而有效的全局对齐策略，该策略将所有成对点图在一个公共参考系中表示。网络架构基于标准的 Transformer 编码器和解码器，能够利用强大的预训练模型。公式直接提供了场景的 3D 模型以及深度信息。总之，DUSt3R 使许多几何 3D 视觉任务变得简单。图1。

解读：DUSt3R: Geometric 3D Vision Made Easy

u012854516的专栏

03-05

7067

野外多视角立体重建（MVS）需要首先估算相机参数，例如内在和外在参数。这些参数的获取通常既繁琐又麻烦，但却是在三维空间中对相应像素进行三角测量的必要条件，而三角测量正是所有性能最佳的 MVS 算法的核心。在这项工作中，我们采取了相反的立场，并引入了 DUSt3R，这是一种用于任意图像集合的高密度、无约束立体三维重建的全新范式，即在没有摄像机校准或视点姿势等先验信息的情况下进行操作。我们把成对重建问题看作是点阵图的回归，放宽了通常投影相机模型的硬约束。我们展示了这种表述方式顺利地统一了单目和双目重建情况。

DUSt3R：轻松实现几何 3D 视觉

yorkhunter的博客

08-21

1441

23年CVPR来自芬兰一所大学和欧洲Naver Labs的论文“DUSt3R: Geometric 3D Vision Made Easy”。

【论文解读】CVPR2024：DUSt3R: Geometric 3D Vision Made Easy

qq_35831906的博客

06-30

3496

本文提出了DUSt3R，一种无需相机校准或视点位置信息即可处理任意图像集合的密集、无约束立体3D重建的全新范式。我们将成对重建问题视为点图的回归，放宽了传统投影相机模型的硬约束。这种方法统一了单目和双目重建案例。在提供多于两张图像的情况下，我们进一步提出了一种简单但有效的全局对齐策略，将所有成对点图表达在一个共同的参考框架中。我们基于标准Transformer编码器和解码器的网络架构，利用强大的预训练模型。

（一）综述：dust3d介绍、安装、下载及源码分析分工

weixin_46273149的博客

09-30

1256

2021SC@SDUSC 一、下载与安装官网：Dust3D | Free 3D Modeling Software 软件下载：Download and Install Dust3D — dust3d 1.0.0-rc.1 documentation 源码下载：GitHub - huxingyi/dust3d: Dust3D is a cross-platform open-source 3D modeling software. Auto UV unwrapping, auto riggin.

dust3r-slam

01-06

### Dust3R-SLAM 技术概述 Dust3R-SLAM 是一种基于视觉的 SLAM (Simultaneous Localization and Mapping) 系统，旨在通过摄像头输入实现环境的三维重建和机器人自身的精确定位。该系统利用空间记忆机制来增强长期运行下的稳定性和准确性[^2]。 ### 使用教程 #### 下载与安装为了获取并设置 Dust3R-SLAM 开发环境，请按照以下说明操作： 1. **克隆仓库** 执行命令以下载项目源码到本地计算机： ```bash git clone https://github.com/HengyiWang/spann3r.git cd spann3r ``` 2. **依赖项准备** 安装必要的 Python 库和其他工具包，通常可以通过 pip 或者 conda 来完成这些库的安装工作。具体需求见 `requirements.txt` 文件。 ```bash pip install -r requirements.txt ``` #### 配置环境变量确保所有路径配置正确无误，并根据个人操作系统调整相应的 shell profile 脚本（如 `.bashrc`, `.zshrc`）。添加如下行至文件末尾以便于后续调用程序时自动加载所需环境变量： ```shell export SPANNNER_PATH=/path/to/your/cloned/repo source $SPANNNER_PATH/scripts/setup_env.sh ``` #### 编译 C++ 组件如果存在任何编写的C/C++扩展模块，则需遵循官方文档指示进行编译过程。一般情况下会涉及到 cmake 工具链以及 make 命令的应用: ```bash mkdir build && cd $_ cmake .. make -j$(nproc) cd .. ``` ### 示例代码展示下面给出一段简单的Python脚本来启动 Dust3R-SLAM 并处理视频流作为输入数据源之一： ```python from dust3r_slam import SpanNer, Visualizer if __name__ == "__main__": # 初始化Spanner实例 slam_system = SpanNer() try: while True: frame = get_next_frame() # 用户自定义函数用于读取图像帧 if not frame.any(): break result = slam_system.process(frame) visualizer = Visualizer(result['map'], result['pose']) visualizer.show() finally: slam_system.shutdown() ```