python如何对两个矩阵进行拼接_一起学opencv-python三十五（特征匹配之求取变换矩阵和图像拼接融合）...

最新推荐文章于 2023-02-16 14:54:15 发布

weixin_39827034

最新推荐文章于 2023-02-16 14:54:15 发布

阅读量717

点赞数 1

文章标签： python如何对两个矩阵进行拼接

官方例子给的是用掩模来过滤点的代码，其实效果是一样的，这个调用不需要加_create。

掩模的话，就是只有对应位置非0，才会把连线画出来的，上面不知道你们是否还记得**的用法。

这个输入只能是两个参数，这两个参数应该规定就是字典了，下面这样其实也是可以的。

我稍微比较了一下时间：

enmmm,FLANN并不是时间更短啊。

还有一点需要注意的是：

前两个不是用二进制描述的，没有问题，这里用二进制描述的就不行了。

显示的是不支持这种格式的。

BRISK的也不行。说明FLANN_INDEX_KDTREE算法不能用二进制的描述。

用了opencv官方给的ORB的例子也出错。我的opencv版本这里再说一下：

不过opencv已经出了4，肯定时会有一定的变化的。不过其实问题在于数据格式，在网上查了资料http://answers.opencv.org/question/59996/flann-error-in-opencv-3/

说是flann的输入需要时浮点类型的32F。

我这里查到了汉明2距离的计算，它就是把两个比特位相加，然后按照一个比特位对待，然后按照汉明距离计算。

不过不能按照汉明距离去计算。

这里我们只是利用了normalize函数来把整数化为32F，不过这样其实有问题，因为原来的二进制应该按照汉明距离来匹配，但是现在却是按照欧式距离。我们看一下结果：

有几个还不错，但是蓝线时明显不对的。现在还不太知道FLANN怎么按照汉明距离来分类。这个其实用np.float32也可以实现：

我们上面做的事情是在一张图片上找到特征点，我们找另一张图片，也找到特征点，然后匹配这些特征点。简单地说，我们在图中找到了一个物体某些部分的位置。这个信息足以在第二张图片中找到这个物体（也就是说我们在第二张图片中找到第一张图片中的指定物体）。这个我们前面尝试过，用模板匹配和直方图匹配都试过，但是，它们的尺度和旋转不变性很差，以前我们介绍过七种矩，它们的值可以用来作为识别物体的工具，现在我们用的是特征点匹配。有的时候，比如图像配准，我们需要知道两张图像的透视变换关系（之所以说是透视变换是因为它可以包含仿射变换）。我们是用calib3d模块里面的cv2.findHomography函数。如果我们把两幅图对应的点集作为参数传进去。它会找到这个透视变换关系，也就是透视变换矩阵M。关于透视变换，可以看一看：

找到了透视变换关系之后可以用cv2.perspectiveTransform来实现这个变换，我们知道在匹配的时候会出现错误，这会影响最后的结果。为了解决这个问题，使用RANSAC或者LEAST_MEDIAN算法来解决。所以好的匹配给出的是好的结果，被叫做样本点，其它的不太好的结果叫做极端点。cv2.findHomography会返回一个掩模，这个掩模可以区分样本点和极端点。我们先来研究一下这两个函数：

首先注意输入的类型应该是32F。第三个参数比较重要，是方法，0用的是用所有点的最小二乘法，这个大家都学过，其实这个找关系的步骤就像是一个拟合的过程，其实就是确定透视矩阵M的8个参数，但是其实只需要4对点就可以确定8个参数，但是我们不止有4个点，我们可以确定很多组参数，怎么找到一组合适的参数呢？最小二乘给出了一种评价方法，就是让误差的平方和最小。RANSAC参考：https://www.cnblogs.com/weizc/p/5257496.html

和https://blog.csdn.net/zinnc/article/details/52319716

这种算法也很好理解，就是随机取四对点，计算出透视变换矩阵，再拿其它点经过这个透视变换，看看变换的结果和匹配点的距离有多远，如果这个距离太大，就舍弃这一组四个点，重复选点，直到满足一定条件，当然每次取的可以不是4对点，每次用最小二乘算出来一个透视变换关系。 Least-Median是最小二乘的改进，因为点里面会有很多噪声胡总和说无效点，计算误差平方和会被无效点或者说离群点带偏，因为为了让它们的偏差变小，整个拟合结果就被带偏了。而加权和或许是一个不错的方法，不过权重怎么给呢？这个权重可以根据最后的误差平方和来调整，不过这个比较麻烦。用误差平方的中值最小作为目标就会比较好，因为中值不容易被噪声带偏。参考https://blog.csdn.net/z63er9uc37lyne9v0m/article/details/83179584

参考https://blog.csdn.net/tianwaifeimao/article/details/48543361

这个说明的额比较详细：

第四个参数是阈值，也就是最大的允许的透视变换偏差，如果超过这个偏差，就不作为样本点（用在RANSAC和RHO方法里）。偏差用的是二范数，对于点来说就是欧式距离。mask是输出的矩阵，它标记了样本点和极端点（离群点）。maxiters是RANSAC的最大迭代次数，confidence是置信度，越大的话两个集合匹配的结果越好，但是剩下的点会很少。

默认的方法是0，也就是最小二乘法，最后的结果可能找不出一个变换矩阵，这是返回的是空矩阵。原来我们用过:

这个函数的输入是四对点，结果是确定的，方程是封闭的。而上面用的可以输入多于4个点，用不同的方法可以得到不同的结果，因为方程比未知数多，就要用到一些拟合的方法。

这个是实现变换的函数，输入可以是二维点，这个时候变换矩阵是3×3的，也可以是三维点，变换矩阵是4×4的。

这个是更直接一点，为什么里面会有插值呢？因为变换之后的结果不一定是整数，但是显示的时候一定是整数，那么就得用插值来得到整数点的值了。代码：

这里设定了一个最小匹配点对数，如果获得的有效匹配点对数太少，不足以我们找到这个变换关系或者说变换关系不好。如果得到足够多的匹配点对，我们可以得到匹配点对在图像中的坐标，然后我们用它们来求出透视矩阵。

src_pts = np.float32([ kp1[m.queryIdx].pt for m in good ]).reshape(-1,1,2)

这一句首先float32是findHomography函数输入的要求，m.querydx是点的索引，再经过kp1就得到了坐标，最后的reshpe(-1,1,2)是为了符合格式：

这样也就是-1代表是不确定的值，不过应该是个整数。

看来findHomography的输出应该是样本点标记为1而离群点标记为0了。

图2中红色边框是图一经过映射之后的边界。

换一种方法，用LMEDS：

变换矩阵还是不太一样的呢。

用变换矩阵变换图像之后。说明这个变换矩阵还是很好的。

opencv图像拼接和融合

这个和利用金字塔融合是不一样的，那个是强行融合，这个是找到相对应的特征点，然后根据特征点匹配的结果来拼接和融合。参考了https://www.cnblogs.com/skyfsm/p/7411961.html和http://blog.sina.com.cn/s/blog_cfc0eb8f0101k8vz.html