文本分割之垂直投影法基于OpenCV(python)的实现

在我的上一篇博客中讲述了水平投影法取出文本行图像的实现,在这里将用垂直投影法对文本行的每个字符进行分割。下图是用水平投影法切割的文本行:
在这里插入图片描述
文本分割的原理如下,先用水平投影取出单一文本行,接着使用垂直投影法达到对单个字符进行分割。
代码如下:

import numpy as np 
import cv2 

def get_vvList(list_data):
    #取出list中像素存在的区间
    vv_list=list()
    v_list=list()
    for index,i in enumerate(list_data):
        if i>0:
            v_list.append(index)
        else:
            if v_list:
                vv_list.append(v_list)
                #list的clear与[]有区别
                v_list=[]
    return vv_list

if __name__=='__main__':
    img_bgr=cv2.imread('./testImg/2.png',1)
    if not img_bgr is None:
        img=img_bgr.copy()
        img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        #二值化
        t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
        '''
        垂直投影为从上往下投射,统计每一列的黑色像素总数
        '''
        rows,cols=binary.shape
        ver_list=[0]*cols
        for j in range(cols):
            for i in range(rows):
                if binary.item(i,j)==0:
                    ver_list[j]=ver_list[j]+1
        '''
        对ver_list中的元素进行筛选,可以去除一些噪点
        '''
        ver_arr=np.array(ver_list)
        ver_arr[np.where(ver_arr<1)]=0
        ver_list=ver_arr.tolist()

        #绘制垂直投影
        img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
        for j in range(cols):
            pt1=(j,rows-1)
            pt2=(j,rows-1-ver_list[j])
            cv2.line(img_white,pt1,pt2,(0,),1)
        cv2.imshow('垂直投影',img_white)
        cv2.waitKey(0)

        #切割单一字符
        vv_list=get_vvList(ver_list)
        for i in vv_list:
            img_ver=img_bgr[:,i[0]:i[-1]]
            cv2.imshow('单一字符',img_ver)
            cv2.waitKey(0)

运行程序,垂直投影图像如下图所示:
在这里插入图片描述
分割的单一字符如下图:
在这里插入图片描述
单个数字已经正确分割出来了。

  • 7
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Keras深度学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值