准备工作
首先下载unflow工程,
git clone https://github.com/simonmeister/UnFlow.git
将config.ini搬出来
cp config_template/config.ini .
然后运行(过程中会自动下载数据集)
cd src
python run.py --ex my_experiment --debug True # 如果不打开debug选项则不会summary Graph和图片,展示效果不大好
慢慢等待,数据会下载好,然后解压。(因为数据很大,所以下载和解压都需要花一阵子的时间)
如果只想测试flying chairs数据集,而不想运行kitti数据集,则可以对应修改config.ini
dataset = chairs
如果干脆不想下载kitti数据集,则需要在run.py中删除下载的行(因为kitti数据集的链接下载太慢,所以没有下载)
还需要解决的问题
当30多G的Flying Chairs数据下载完毕,又花了好一阵子解压,应该可以运行了吧?事实上在跑python run.py --ex my_experiment --debug True
的时候还是报了很多的错误。而这些错误需要我们一个一个解决了,这里做下记录。
TypeError: unsupported operand type(s) for %: ‘NoneType’ and 'int
第一个错误是util.py
中第23行的,当我们在这行语句前加上ipdb调试时,发现,这个传入的tensor是一个shape不明的tensor,如果想从这里面得到shape,得到的shape自然也是问好。当然就不能喝2进行模运算了。
【注】推荐使用python库ipdb来debug,特别推荐喜欢用gdb来debug的朋友。使用ipdb可以在代码运行到该行的时候展开iPython,在iPython的可交互环境下就很容易可以输出我们想要知道的变量。并且也可以用和gdb类似的n
等命令,进行单步运行,从而进行调试。添加ipdb断点的代码是import ipdb; ipdb.set_trace()
。多啰嗦一句,ipdb其实对于tensorflow不是特别方便,因为当图没有运行起来的时候,输出的只是有shape而没有value的tensor;相比起来如果是在PyTorch中,按照这样的思路可以输出任意位置的Tensor,这样就很方便。
ipdb> tensor
<tf.Tensor 'random_affine/StopGradient:0' shape=(?, ?, ?, ?) dtype=float32>
当发现了问题,我们还不能解决,因为这个tensor是从外部传进来的。所以我们需要根据报错中的stack来找哪儿调用了这个函数。从下面的stack中可以看到是在unsupervised_loss的位置调用了downsample,于是我们又去看这个函数,
File "/UnFlow/src/e2eflow/core/train.py", line 160, in get_train_and_loss_ops
loss_ = self.loss_fn(batch, self.params, self.normalization)
File "/UnFlow/src/e2eflow/core/unsupervised.py", line 99, in unsupervised_loss
im1_s = downsample(im1_norm, 4)
File "/UnFlow/src/e2eflow/core/util.py", line 24, in downsample
if height%2==0 and width%2==0:
在unsupervised.py
中,最开始发现im1和im2都是正常的四个维度都知道的数据,
> /UnFlow/src/e2eflow/core/unsupervised.py(40