图像文字识别之图像分割(待改进)

 原图片:

二值化处理:

切割后的图片:

主要问题:

  1. 一个字被切位2张图片
  2. 从某一位置开始没有进行切割
  3. 文字信息缺失即左右两边被多切去一列

代码:

import cv2
import numpy as np

#读入图片,将图片转化为2值图,最后转化为数组
image = cv2.imread('C:/Users/wang/Desktop/test.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY_INV)
thresh = np.array(thresh)

#统计每行黑点个数,参数为二值图数组
def countPoint(img):
    re = []
    for th in img:
        re.append(sum(th)/255)
    return re

#根据每行黑点个数选取进行切割的位置,参数为二值图数组,以及切割方向
def findPoint(img,axis):
    if(axis == 'y'):
        img = img.T
    start = -1
    end = -1
    result = []
    countx = countPoint(img)
    for x in range(len(countx)):
        if(countx[x] != 0 and start<0):
            start = x
        elif(countx[x] !=0):
            end = x
        elif(countx[x] == 0 and start>0):
            result.append([start, end])
            start, end = -1, -1
    return result

#根据切割位置进行分割,参数为二值图数组,以及切割方向
def Cut(img,axis):
    point = findPoint(img, axis)
    re = []
    for x in point:
        if (axis == 'x'):
            re.append(img[x[0]: x[1]])
        elif(axis == 'y'):
            re.append(img[:, x[0]: x[1]])
    return re

#绘制切割后的图像
def cutImage(img):
    count = 1
    for r_x in Cut(img,'x'):
        for r_y in Cut(r_x, 'y'):
            cv2.imwrite("C:/Users/wang/Desktop/image/" + str(count) + ".jpg", r_y)
            count += 1

cutImage(thresh)

改进后:https://blog.csdn.net/qq_36110736/article/details/84577020

  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值