python检测图像中的矩形_详解利用OpenCV提取图像中的矩形区域（PPT屏幕等）

最新推荐文章于 2024-07-03 19:44:47 发布

weixin_39617405

最新推荐文章于 2024-07-03 19:44:47 发布

阅读量3k

点赞数 2

文章标签： python检测图像中的矩形

本文介绍了如何利用OpenCV在Python中检测图像中的矩形，特别是PPT屏幕。通过预处理、边缘检测、轮廓提取、凸包检测和角点检测，找到矩形的四个角坐标，进而进行透视变换，将矩形区域翻转并充满图像。这种方法依赖于矩形部分与背景的亮度对比，当对比度不高时，检测效果会受到影响。

摘要由CSDN通过智能技术生成

前言

最近参加了大创项目，题目涉及到计算机视觉，学姐发了个修正图像的博客链接，于是打算用这个题目入门OpenCV。

分析问题

照片中的PPT区域总是沿着x,y,z三个轴都有倾斜(如下图)，要想把照片翻转到平行位置，需要进行透视变换，而透视变换需要同一像素点变换前后的坐标。由此可以想到，提取矩形区域四个角的坐标作为变换前的坐标，变换后的坐标可以设为照片的四个角落，经过投影变换，矩形区域将会翻转并充满图像。

因此我们要解决的问题变为：提取矩形的四个角落、进行透视变换。

提取矩形角落坐标

矩形的检测主要是提取边缘，PPT显示部分的亮度通常高于周围环境，我们可以将图片阈值化，将PPT部分与周围环境明显的分别开来，这对后边的边缘检测非常有帮助。

检测矩形并提取坐标需要对图像进行预处理、边缘检测、提取轮廓、检测凸包、角点检测。

预处理

由于手机拍摄的照片像素可能会很高，为了加快处理速度，我们首先缩小图片，这里缩小了4倍。

pyrDown(srcPic, shrinkedPic); //减小尺寸加快运算速度

pyrDown(shrinkedPic, shrinkedPic);

转化为灰度图

cvtColor(shrinkedPic, greyPic, COLOR_BGR2GRAY); //转化为灰度图

中值滤波

medianBlur(greyPic, greyPic, 7); //中值滤波

转为二值图片

threshold(greyPic, binPic, 80, 255, THRESH_BINARY); //阈值化为二值图片

此时图片已经变成了这个样子：

可见PPT部分已经与环境分离开来。

边缘检测与轮廓处理

进行Canny边缘检测

Canny(binPic, cannyPic, cannyThr, cannyThr*FACTOR); //Canny边缘检测

这里 cannyThr = 200, FACTOR = 2.5

可能由于边缘特征过于明显，系数在100-600范围(具体数字可能有出入，反正范围非常大)内产生的效果几乎相同。

提取轮廓

vector> contours; //储存轮廓

vector hierarchy;

findContours(cannyPic, contours,

最低0.47元/天解锁文章

weixin_39617405

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
python检测图像中的矩形_详解利用OpenCV提取图像中的矩形区域（PPT屏幕等）

前言最近参加了大创项目，题目涉及到计算机视觉，学姐发了个修正图像的博客链接，于是打算用这个题目入门OpenCV。分析问题照片中的PPT区域总是沿着x,y,z三个轴都有倾斜(如下图)，要想把照片翻转到平行位置，需要进行透视变换，而透视变换需要同一像素点变换前后的坐标。由此可以想到，提取矩形区域四个角的坐标作为变换前的坐标，变换后的坐标可以设为照片的四个角落，经过投影变换，矩形区域将会翻转并充满图像。...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。