将图片文字分割
原图:
图片预处理:图片二值化以及图片降噪处理。
# 图片二值化
def binarization(img,threshold):
#图片二值化操作
width,height=img.size
im_new = img.copy()
for i in range(width):
for j in range(height):
a = img.getpixel((i, j))
aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
if (aa <= threshold):
im_new.putpixel((i, j), (0, 0, 0))
else:
im_new.putpixel((i, j), (255, 255, 255))
# im_new.show() # 显示图像
return im_new
# 图片降噪处理
def clear_noise(img):
# 图片降噪处理
x, y = img.width, img.height
for i in range(x-1):
for j in range(y-1):
if sum_9_region(img, i, j) < 600:
# 改变像素点颜色,白色
img.putpixel((i, j), (255,255,255))
# img = np.array(img)
# # cv2.imwrite('handle_two.png', img)
# # img = Image.open('handle_two.png')
img.show()
return img
# 获取田字格内当前像素点的像素值
def sum_9_region(img, x, y):
"""
田字格
"""
# 获取当前像素点的像素值
a1 = img.getpixel((x - 1, y - 1))[0]
a2 = img.getpixel((x - 1, y))[0]
a3 = img.getpixel((x - 1, y+1 ))[0]
a4 = img.getpixel((x, y - 1))[0]
a5 = img.getpixel((x, y))[0]
a6 = img.getpixel((x, y+1 ))[0]
a7 = img.getpixel((x+1 , y - 1))[0]
a8 = img.getpixel((x+1 , y))[0]
a9 = img.getpixel((x+1 , y+1))[0]
width = img.width
height = img.height
if a5 == 255: # 如果当前点为白色区域,则不统计邻域值
return 2550
if y == 0: # 第一行
if x == 0: # 左上顶点,4邻域
# 中心点旁边3个点
sum_1 = a5 + a6 + a8 + a9
return 4*255 - sum_1
elif x == width - 1: # 右上顶点
sum_2 = a5 + a6 + a2 + a3
return 4*255 - sum_2
else: # 最上非顶点,6邻域
sum_3 = a2 + a3+ a5 + a6 + a8 + a9
return 6*255 - sum_3
elif y == height - 1: # 最下面一行
if x == 0: # 左下顶点
# 中心点旁边3个点
sum_4 = a5 + a8 + a7 + a4
return 4*255 - sum_4
elif x == width - 1: # 右下顶点
sum_5 = a5 + a4 + a2 + a1
return 4*255 - sum_5
else: # 最下非顶点,6邻域
sum_6 = a5+ a2 + a8 + a4 +a1 + a7
return 6*255