自动调整图片方向并划窗剪裁-CSDN博客

本文链接：https://blog.csdn.net/weixin_47479625/article/details/113449495

本文介绍了一种针对大分辨率图片的处理方法，包括自动调整图片角度、划窗剪裁和坐标映射。首先，通过转灰度图、二值化、中值滤波和轮廓检测获取图片外框，然后计算角度偏差并应用仿射变换。接着进行裁剪和划窗分割。最后，详细阐述了如何批量化处理图片以及如何将坐标从调整后的图片映射回原图，适用于瓷砖表面瑕疵质检等场景。

摘要由CSDN通过智能技术生成

❝
最近在“2021广东工业智造创新大赛智能算法赛：瓷砖表面瑕疵质检” 中遇到一些图片，有不同角度偏差。类似卫星图，分辨率特别大，目标却特别小，这就需要对原始图片自动调整角度，划窗剪裁和相应的坐标映射。
❞

读取图片

对于大图片来说，直接使用cv2.imread会比PIL再转numpy array慢 30% 左右，这里推荐使用Image.open读取。

import numpy as np
import cv2
from PIL import Image
# org_img = cv2.imread(BASE_DIR + img_file)
org_img = Image.open(BASE_DIR + img_file)
org_img = cv2.cvtColor(np.asarray(org_img), cv2.COLOR_RGB2BGR)

检测外框

1. 转灰度图

# 灰度图
greyPic = cv2.cvtColor(org_img, cv2.COLOR_BGR2GRAY)

2. 对图像进行二值化操作

这里阈值采用平均像数值，可满足大多数场景，特殊场合下可以自己调整。

# threshold(src, thresh, maxval, type, dst=None)
# src是输入数组，thresh是阈值的具体值，maxval是type取THRESH_BINARY或者THRESH_BINARY_INV时的最大值
# type有5种类型,这里取0：THRESH_BINARY ，当前点值大于阈值时，取maxval，也就是前一个参数，否则设为0
# 该函数第一个返回值是阈值的值，第二个是阈值化后的图像
ret, binPic = cv2.threshold(greyPic, greyPic.mean(), 255, cv2.THRESH_BINARY)

3. 中值滤波

median = cv2.medianBlur(binPic, 5)

4. 找出轮廓

# findContours()有三个参数：输入图像，层次类型和轮廓逼近方法
# 该函数会修改原图像，建议使用img.copy()作为输入
# 由函数返回的层次树很重要，cv2.RETR_TREE会得到图像中轮廓的整体层次结构，以此来建立轮廓之间的‘关系'。
# 如果只想得到最外面的轮廓，可以使用cv2.RETE_EXTERNAL。这样可以消除轮廓中其他的轮廓，也就是最大的集合
# 该函数有三个返回值：修改后的图像，图像的轮廓，它们的层次
contours, hierarchy = cv2.findContours(median, cv2.RETR_CCOMP, cv2.CHAIN_APPROX_SIMPLE)

5. 获取最小外接矩形

maxArea = 0
# 挨个检查看那个轮廓面积最大
for i in range(len(contours)):
    if cv2.contourArea(contours[i]) > cv2.contourArea(contours[maxArea]):
        maxArea = i
hull = cv2.convexHull(contours[maxArea])
hull = np.squeeze(hull)

# 得到最小外接矩形的（