Python+OpenCV竖版古籍文字分割

最新推荐文章于 2023-02-16 13:39:35 发布

aodeng6535

最新推荐文章于 2023-02-16 13:39:35 发布

阅读量1.2k

点赞数 1

文章标签：人工智能 python

原文链接：http://www.cnblogs.com/SaltyFishQF/p/11474482.html

版权

本文介绍了使用Python和OpenCV处理竖版古籍文字分割的方法。通过投影法和轮廓检测解决文字过度分割问题，针对古籍文字从上到下的特性调整算法，并优化了单行文本列扫描的过度分割现象，实现了较好的文字识别效果。

摘要由CSDN通过智能技术生成

在做图片文字分割的时候，常用的方法有两种。一种是投影法，适用于排版工整，字间距行间距比较宽裕的图像；还有一种是用OpenCV的轮廓检测，适用于文字不规则排列的图像。

1. 思路

一开始想偷个懒，直接用OpenCV的模型，结果发现效果不佳。文字出现了过度分割的问题，部分文字甚至没有被识别：

于是只好使用传统方法，投影法。对文字图片作横向和纵向投影，即通过统计出每一行像素个数，和每一列像素个数，来分割文字。代码参考https://www.cnblogs.com/zxy-joy/p/10687152.html，但是对于古籍来说，需要做一些修改。比如，古籍文字书写在习惯是从上到下的，所以说在扫描的时候应该扫描列投影，在扫描行投影，搞定这次简单的操作顺序修改以后，分割结果如下：

很显然，虽然说没有出现过度分割的问题，但是由于字体有大有小，有的地方两个字被合起来识别成了一个字。那么很显然，只要把这些地方再进行一次列投影，把它们再度拆分成两个字，问题不就解决了么。添加代码：

# 再进行一次列扫描
DcropImg = cropImg[H_start[pos]:H_end[pos], 0:w]
d_h, d_w = DcropImg.shape 
# cv2.imshow("dcrop", DcropImg)
sec_V = getVProjection(DcropImg)
c1, c2 = scan(sec_V, 0)
if len(c1) > len(c2):
  c2.append(d_w)

# cv2.waitKey(0)
if len(c1) == 1:
    Position.append([V_start[i],H_start[pos],V_end[i],H_end[pos]])
else:
    for x in range(len(c1)):
        Position.append([V_start[i]+c1[x], H_start[pos],V_start[i]+c2[x], H_end[pos]])

2. 优化

对单行文本做列扫描，很容易出现过度分割的问题。因为只有一行，会扫描到很多没有像素点的列，最终就会出现这种情况：

为了避免这种过度分割的情况，可以添加一个检测两个分割之间距离的代码，使距离较近的分割进行合并。

x = 1
while x < len(c1):
  if c1[x] - c2[x-1] < 12:
    c2.pop(x-1)
    c1.pop(x)
    x -= 1
    x += 1

3. 代码

再通过添加

最低0.47元/天解锁文章

aodeng6535

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫