我们在进行半监督方法的时候,输入的仅仅是 rgbd 图像,这个时候呢, 两个图像的匹配点的 Ground truth 是通过 depth 生成的。
过程是:
左边图像某点 x1 + 深度信息 + 两个图的内参和外参 = 右边图像的对应点
其实不用理解原理,只用记住有这样的技巧就够了。
而我们所说的gird_position,只是上述过程代码中的中间产物罢了。看下面的图就明白了。本质上是【方便地构造两行索引】
而大多数的操作都会对这个网格进行一个上采样三次,也就是循环执行三次
grid_position = grid_position*2 + 0.5
就得到了下面的结果:
我们发现很奇怪,因为这里的坐标都是小数,根本不可能对应到图像的坐标索引,其实就是这样的。 这样的一个结果,就是为了我们去做非线性二次插值使用的。 别忘了:
非线性二次插值中, 使用到了非整数的坐标