MiDaS 开源项目安装与使用指南

郜朵欣

于 2024-08-09 08:13:00 发布

阅读量628

点赞数

本文链接：https://blog.csdn.net/gitblog_00491/article/details/141049038

版权

MiDaS 开源项目安装与使用指南

MiDaS项目地址:https://gitcode.com/gh_mirrors/mid/MiDaS

一、项目介绍

MiDaS（Monocular Depth Estimation using Self-supervised learning）是Intel的一个单眼深度估计开源项目，通过自监督学习的方式来预测图像的深度图。它利用了视觉信号在不同视角下的变化来训练模型，从而能够从单一输入图像中恢复出场景的三维结构。

项目亮点:

无监督学习: 利用单目视频序列进行自我监督训练，无需昂贵的激光雷达数据。
高效运行: 在广泛使用的硬件上实现实时性能，适合嵌入式设备或移动平台。
适应性强: 可以处理多种环境下的图像，包括室内、室外以及各种光照条件。
高质量结果: 输出精确的深度地图，可用于机器人导航、增强现实等多个领域。

二、项目快速启动

为了快速启动MiDaS项目，我们需要准备以下环境：

环境配置

确保你的系统已经安装了Python 3.6以上版本，以及必要的依赖库，包括但不限于PyTorch、OpenCV等。你可以通过创建一个虚拟环境并激活它，然后使用pip命令来安装所有必需的包。

virtualenv -p python3 myenv
source myenv/bin/activate
pip install torch torchvision opencv-python numpy scipy matplotlib Pillow tifffile h5py imageio fire tqdm

克隆MiDaS仓库

接下来，我们将从GitHub克隆MiDaS项目到本地目录。

git clone https://github.com/intel-isl/MiDaS.git
cd MiDaS/

下载预训练模型

MiDaS提供了几个预先训练好的模型，用于不同的应用场景。你需要下载这些模型文件以便后续使用。

wget https://storage.googleapis.com/midas_models/midas_v21_small_640x640.zip
unzip midas_v21_small_640x640.zip

运行示例代码

现在可以运行一些示例脚本来测试MiDaS的功能。这里我们选择一张图片作为输入，看看能否正确地生成深度地图。

from midas_utils import load_model, read_image, preprocess_image, post_process_depth, write_depth

model_path = 'midas_v21_small_640x640'
image_path = '/path/to/input/image.jpg'

model = load_model(model_path)
image = read_image(image_path)

input_batch = preprocess_image(image).unsqueeze(0)
with torch.no_grad():
    prediction = model.forward(input_batch)
    prediction = torch.nn.functional.interpolate(
        prediction.unsqueeze(1),
        size=image.shape[:2],
        mode="bicubic",
        align_corners=False,
    ).squeeze()
output = post_process_depth(prediction)
write_depth(output, fname='depth_output.png', bits=2)

完成上述步骤后，你会在一个名为depth_output.png的文件中看到由输入图片生成的深度图。