目录
1、寻找英语试卷填空题的下划线任务(形态学操作+HoughLines)
2、指定目标提取任务 (二值分割 + 形态学 + 横纵比计算)
3、药片分割任务 (距离变换+分水岭算法)
代码基于:opencv-python (3.4.0.12)
1. 直线检测
需求:寻找英语试卷填空题的下划线,这个对后期的切图与自动识别都比较重要。 实现思路:通过图像形态学操作来寻找直线,霍夫获取位置信息与显示
import cv2
from PIL import Image
import numpy as np
raw_ = cv2.imread("2_1.jpg")
raw = cv2.cvtColor(raw_,cv2.COLOR_BGR2RGB)
raw_gray = cv2.cvtColor(raw,cv2.COLOR_RGB2GRAY)
image1 = Image.fromarray(raw.astype('uint8')).convert('RGB')
print("下面是原图")
display(image1)
image2 = Image.fromarray(raw_gray.astype('uint8')).convert('RGB')
print("下面是灰度图")
display(image2)
ret,thresh2 = cv2.threshold(raw_gray,0,255,cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
image3 = Image.fromarray(thresh2.astype('uint8')).convert('RGB')
print("下面是二值图")
display(image3)
# 一个开操作
# 开操作 = 腐蚀+膨胀 ,输入图像 + 结构元素
# 作用:用来消除小物体、平滑较大物体的边界的同时并不明显改变其面积,提取水平或竖直的线
op_kernel = cv2.getStructuringElement(cv2.MORPH_RECT,(60,1))
#注意这个60*1的核,就是提取水平直线用的
opening = cv2.morphologyEx(thresh2, cv2.MORPH_OPEN, op_kernel)
#膨胀,让直线更加明显
image4 = Image.fromarray(opening.astype('uint8')).convert('RGB')
print("下面是做了开操作")
display(image4)
di_kernel = cv2.getStructuringElement(cv2.MORPH_RECT,(3,3))
dilate = cv2.dilate(opening,di_kernel)
#再次膨胀会让直线更粗
image5 = Image.fromarray(dilate.astype('uint8')).convert('RGB')
print("下面是再次膨胀图")
display(image5)
#霍夫变换检测直线
lines = cv2.HoughLinesP(dilate, #输入图像
1, #累加器分辨率
np.pi/180.0,#角度分辨率
30, #确定直线之前收到的最小投票数
minLineLength=20, #直线的最小长度
maxLineGap=0) #直线上允许的最大缝隙
line = lines[:,0,:]
for x1,y1,x2,y2 in line[:]:
cv2.line(raw, #输入图像
(x1,y1), #起点
(x2,y2), #终点
(255,0,0), #颜色
2) #宽度
image1 = Image.fromarray(raw.astype('uint8')).convert('RGB')
print("下面是霍夫直线检测图")
display(image1)
#效果还不错,就不用过滤结果了
下面是原图
下面是灰度图
下面是二值图
下面是做了开操作
下面是再次膨胀图
下面