简单实现图片文字分割

最新推荐文章于 2024-02-12 19:21:55 发布

上不了山的小非洲

最新推荐文章于 2024-02-12 19:21:55 发布

阅读量2.6k

点赞数 2

文章标签： python 图像识别

本文链接：https://blog.csdn.net/weixin_43898483/article/details/110950073

版权

本文介绍了如何使用Python对含有文字的图片进行预处理，包括二值化和降噪，然后通过水平和垂直投影确定文字区域，从而实现文字的分割。提供了一段代码示例来完成这一过程。

摘要由CSDN通过智能技术生成

将图片文字分割

原图：
在这里插入图片描述
图片预处理：图片二值化以及图片降噪处理。

# 图片二值化
def binarization(img,threshold):
    #图片二值化操作
    width,height=img.size
    im_new = img.copy()
    for i in range(width):
        for j in range(height):
            a = img.getpixel((i, j))
            aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
            if (aa <= threshold):
                im_new.putpixel((i, j), (0, 0, 0))
            else:
                im_new.putpixel((i, j), (255, 255, 255))

    # im_new.show()  # 显示图像
    return im_new

# 图片降噪处理
def clear_noise(img):
    # 图片降噪处理

    x, y = img.width, img.height
    for i in range(x-1):
        for j in range(y-1):
            if sum_9_region(img, i, j) < 600:
                # 改变像素点颜色，白色
                img.putpixel((i, j), (255,255,255))
    # img = np.array(img)
    #     # cv2.imwrite('handle_two.png', img)
    #     # img = Image.open('handle_two.png')
    img.show()
    return img

# 获取田字格内当前像素点的像素值
def sum_9_region(img, x, y):
    """
    田字格
    """
    # 获取当前像素点的像素值

    a1 = img.getpixel((x - 1, y - 1))[0]
    a2 = img.getpixel((x - 1, y))[0]
    a3 = img.getpixel((x - 1, y+1 ))[0]
    a4 = img.getpixel((x, y - 1))[0]
    a5 = img.getpixel((x, y))[0]
    a6 = img.getpixel((x, y+1 ))[0]
    a7 = img.getpixel((x+1 , y - 1))[0]
    a8 = img.getpixel((x+1 , y))[0]
    a9 = img.getpixel((x+1 , y+1))[0]
    width = img.width
    height = img.height

    if a5 == 255:  # 如果当前点为白色区域,则不统计邻域值
        return 2550

    if y == 0:  # 第一行
        if x == 0:  # 左上顶点,4邻域
            # 中心点旁边3个点
            sum_1 = a5 + a6 + a8 + a9
            return 4*255 - sum_1
        elif x == width - 1:  # 右上顶点
            sum_2 = a5 + a6 + a2 + a3
            return 4*255 - sum_2
        else:  # 最上非顶点,6邻域
            sum_3 = a2 + a3+ a5 + a6 + a8 + a9
            return 6*255 - sum_3

    elif y == height - 1:  # 最下面一行
        if x == 0:  # 左下顶点
            # 中心点旁边3个点
            sum_4 = a5 + a8 + a7 + a4
            return 4*255 - sum_4
        elif x == width - 1:  # 右下顶点
            sum_5 = a5 + a4 + a2 + a1
            return 4*255 - sum_5
        else:  # 最下非顶点,6邻域
            sum_6 = a5+ a2 + a8 + a4 +a1 + a7
            return 6*255

最低0.47元/天解锁文章

上不了山的小非洲

关注

2
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
简单实现图片文字分割

将图片文字分割原图：图片预处理：图片二值化以及图片降噪处理。# 图片二值化def binarization(img,threshold): #图片二值化操作 width,height=img.size im_new = img.copy() for i in range(width): for j in range(height): a = img.getpixel((i, j)) aa = 0.30
复制链接

扫一扫