在倾斜校正的预处理完成后便可以开始对处理后的文本文档进行定位与切割了。
总体思路:先切割行,再切割列,得到一张张字体图片并标号储存方便后续的识别。
其中切割的方法采用了投影法,即在二值化后判断每一行的黑白色素。
Python测试代码:
import YuChuLi
import cv2
import numpy as np
V_PROJECT = 1
H_PROJECT = 2
count = 0
def get_text_project(img_text, mode): # 二值化之后通道为1,故img.shape[2]不存在了(相当于降维了)
pos = []
if mode == V_PROJECT:
pos = np.zeros([img_text.shape[1]], dtype=np.int)
for i in range(img_text.shape[0]):
for j in range(img_text.shape[1]):
if img_text[i, j] == 255:
pos[j] += 1
if mode == H_PROJECT:
pos = np.zeros([img_text.shape[0]], dtype=np.int)
for i in range(img_text.shape[1]):
for j in range(img_text.shape[0]):
if