vision.middleburry.edu 官网翻译

最新推荐文章于 2022-11-24 22:39:08 发布

West_brook

最新推荐文章于 2022-11-24 22:39:08 发布

阅读量1.1k

点赞数 6

分类专栏：立体匹配文章标签：计算机视觉立体匹配精度评定

立体匹配专栏收录该内容

1 篇文章 0 订阅

订阅专栏

研究了这么久的双目视觉，整体来说还是取得了小小进展，但对于视差结果精度一直没有完成定量评价，今天打算花一天的时间把这个网站研究一下，由于博主英语底子太差，为了日后方便其他读者学习，先将基本的界面翻译出来

我们不提供任何最先进的立体算法的实现。然而，我们提供了我们的评估SDK，以及cvkit，一个轻量级的工具包，包括一个图像和网格查看器，设计用于我们2014年的数据集。

SDK

评估SDK可以从提交页面下载。

cvkit

cvkit是一个轻量级工具包，用于处理各种格式的图像，包括.pfm格式的视差图。它是由Heiko Hirschmuller开发的。源代码(Linux)在Github上维护;在这里，我们还提供了指向Linux (tgz)和Windows (zip)最新版本的链接:

Latest version: github.com/roboception/cvkit
Linux / Source: cvkit-1.7.0-src.tgz
Windows: cvkit-1.7.0-win32.zip

该代码包含“sv”，一个具有有用可视化功能的轻量级图像查看器，以及“plyv”，一个快速网格查看器，也可以在3D中呈现.pfm视差图。有关更多信息，请参见这里的README和USAGE文件。a

Middlebury Stereo Evaluation - Version 3

在这里，您可以下载输入文件、地面实况差异和新的立体声基准测试的评估SDK，并上传您的结果。参见新特性的描述。

Data

我们提供了一个训练集和一个测试集，每个测试集有15对图像对，主要取自2014年的数据集。训练集还包含PFM格式的基本事实差异。图像有三种分辨率，全分辨率(F)、半分辨率(H)和四分之一分辨率(Q)。通常应该使用算法能够处理的最大尺寸，但有时较小的分辨率可以产生更好的结果。请注意，虽然您可以评估您的结果与一半或四分之一大小的GT使用我们的SDK，“官方”评估总是在全分辨率，我们将在必要时对您的结果进行升级。大部分数据集存在真实的“不完善”校正，存在残差y，为此我们还为训练集提供了GT。关于数据集的更多信息，请参阅我们的GCPR 2014论文。

Code

我们的评估SDK由c++代码和shell脚本组成。目前它只适用于Unix / Linux(但也可以在Windows下使用cygwin)。它允许(1)在所有数据集上运行算法;(2)评价训练集的结果;(3)创建所有结果的zip存档，以便提交到在线表。如果您喜欢手动创建zip归档文件或使用您自己的脚本，下面是预期上载格式的描述A。为了将SDK与立体算法一起使用，您必须生成PFM格式的浮点差异。SDK包含用于以PFM格式保存的示例c++代码。它还包含一个例子立体算法，Libelas，修改后写入PFM差异，作为一个例子。

我们还提供了cvkit，一个可视化和转换工具的集合，旨在与我们的目录结构中的PFM文件和校准文件一起工作，特别是快速图像查看器sv和3D查看器plyv。这些都是非常有价值的调试工具，并且是为Linux和Windows平台提供的。如果您的算法已经以16位PGM/PNG/TIFF或浮点TIFF格式保存了差异映射，您还可以使用cvkit的imgcmd程序直接转换为PFM(更多细节可以在SDK文档中找到)。

Eric Psota贡献了MatlabSDK-v2.zip(更新于2017年3月)，这是一个用于与MiddEval3文件交互的Matlab脚本小集合。这些脚本包括一个简单的立体声匹配器，以及一个PFM读写器。

Submit

调整SDK以运行算法或手动创建zip文件之后，就可以上传结果了。您可以在训练集中上传和评估您的结果，次数不限。与之前的立体评估版本一样，您将在临时表中看到您的结果如何与训练集中提交的所有其他结果进行比较。一旦您有了最终的结果集，您就可以在培训集和测试集上上传您的结果，并请求发布这两组结果。为了防止对测试数据进行拟合，我们只允许每个方法进行一次这样的操作，直到发布测试结果之后，您才能看到测试结果。请只上传“最终”结果(发表或即将提交给会议或期刊)。注意，我们只允许在表中每次发布一个结果。如果您有多个算法变体，您可以在训练集中对它们进行评估，但是您应该只选择并上传一个结果用于发布。

A.手动创建用于上载的ZIP文件的说明

我们的SDK适用于Unix/Linux，也适用于使用cygwin的Windows。您应该使用它来运行方法、评估结果和创建一个压缩结果文件。如果由于某种原因不能使用SDK，那么请按照以下说明手动创建用于上传结果的ZIP文件。

视差图像必须与左输入图像对应。图像格式必须是PFM (http://netpbm.sourceforge.net/doc/pfm.html)。这种格式使用一个包含图像大小的小ASCII标头。然后是所有像素的32位浮点值。浮点值存储为二进制(即四个字节)小端字节格式或大端字节格式，取决于标头中比例因子的符号。忽略尺度因子的绝对值。请注意，PFM以相反的顺序存储图像行，即，最后一行图像首先存储。这些值以像素为单位编码差异，没有任何缩放因子。INF为正数的解释为无效，即未知的差距。

密集的视差图像，没有无效的值，应该命名为' disp0xxx .pfm'。稀疏视差图像，其中包含无效的值，例如遮挡，应命名为'disp0xxx_s.pfm'。您可以决定只提交密集的结果还是只提交稀疏的结果，或者同时提交这两种结果。“XXX”应替换为您的算法的名称。

除了视差图像外，还必须为每个图像对指定计算视差图像的时间。只需要一个时间文件;如果你上传稀疏和密集的结果，请测量密集结果的时间。以秒为单位的时间以ASCII编码的浮点值存储在文本文件中。该文件必须只包含该号码，并应被称为' timexxxx .txt'。同样，“XXX”应该是算法的名称。

如果只提交培训结果，则ZIP文件的目录结构必须如下所示。可能缺少disp0XXX.pfm或disp0XXX_s.pfm，但如果可用，您应该同时提供这两种方法。将Y替换为Q、H或F，并将XXX替换为算法的名称。

MiddEval3-SDK_README

除了SDK文件之外，还需要下载输入数据和ground truth数据，并在与SDK文件相同的级别解压。这将导致以下目录的子集:

1. 下载并解压MiddEval3-data-Q.zip和MiddEval3-GT0-Q.zip。你应该有一个目录MiddEval3与以下内容:

2. 编译Libelas如下:

cd alg-ELAS/build
cmake ..
make
cd ../..

3.用程式码/以下方式编译工具:

cd code/imageLib
make
cd ..
make
cd ..

4. Run ELAS:

5. ELAS评估结果:

为了提高效率，评估脚本“runeval”使用与与您的视差图分辨率相同的GT文件disp0GT.pfm。相比之下，“官方”在线评估以全分辨率进行评估，并在必要时对结果进行上采样。需要相应地转换错误阈值，例如，全分辨率为2.0的阈值对应于四分之一分辨率为0.5的阈值。即使有这样的转换，当用GT在全分辨率下进行评估时，数字也略有不同。要获得官方数字，可以使用脚本“runevalF”。为了使用这个脚本，您需要下载完整大小的文件MiddEval3-data-F.zip和middeval3 - gtt - f .zip。一旦你这样做了，就去尝试

Windows:

1) Start CMake GUI
2) Set directories to elas root directory
3) Run configure, configure and generate
4) Open the resulting Visual Studio solution with Visual Studio
5) Switch to 'Release' mode and build all
6) Move 'elas.exe' from libelas/Release to libelas
7) Open a console and navigate to libelas root directory
8) Run 'elas.exe demo' => computes disparity maps in the img directory

West_brook

关注

6
点赞
踩
17

收藏

觉得还不错? 一键收藏
18
评论
vision.middleburry.edu 官网翻译

研究了这么久的双目视觉，整体来说还是取得了小小进展，但对于视差结果精度一直没有完成定量评价，今天打算花一天的时间把这个网站研究一下，由于博主英语底子太差，为了日后方便其他读者学习，先将基本的界面翻译出来我们不提供任何最先进的立体算法的实现。然而，我们提供了我们的评估SDK，以及cvkit，一个轻量级的工具包，包括一个图像和网格查看器，设计用于我们2014年的数据集。...
复制链接

扫一扫