pytesseract 提高印刷体数字识别率走的弯路白底黑字

最新推荐文章于 2024-03-21 22:37:35 发布

大马鱼哈

最新推荐文章于 2024-03-21 22:37:35 发布

阅读量3.2k

点赞数 4

分类专栏： Python 图像处理文章标签： python 图像识别

本文链接：https://blog.csdn.net/majian/article/details/110511268

版权

Python 同时被 2 个专栏收录

19 篇文章 0 订阅

订阅专栏

图像处理

6 篇文章 0 订阅

订阅专栏

屏幕截图里识别数字, 非常正规的白色字体,图片背景略微复杂, 但是识别率不高, 实在无法相信知名软件包居然是这个效果, 反复找资料实验后发现: 图像要 白底黑字白底黑字白底黑字 重要的事情说三遍, 凡是没有白底黑字的也能识别,但是效果惨不忍睹,正确率低于40%.

        height, width, deep = cropImg.shape                 # cropImg是从图片里截取的,只包含一行数字
        gray = cv.cvtColor(cropImg, cv.COLOR_BGR2GRAY)      # 转灰度图
        dst = np.zeros((height, width, 1), np.uint8)        
        for i in range(0, height):                          # 反相 转白底黑字
            for j in range(0, width):
                grayPixel = gray[i, j]
                dst[i, j] = 255 - grayPixel
        ret, canny = cv.threshold(dst, 0, 255, cv.THRESH_BINARY + cv.THRESH_OTSU)   # 二值化
        # psm 7表示单行文字,单个字符psm 10, tessedit_char_whitelist 限定只有数字
        text = pytesseract.image_to_string( canny , config='--psm 7 --oem 3 -c tessedit_char_whitelist=0123456789')
        print ("文字识别",text)

感谢原作者 https://blog.csdn.net/m0_38008027/article/details/105264877

不过他的代码里有一行错误, 导致依然没有白底黑字效果不佳. 网上其他的膨胀腐蚀算法我都尝试了, 真正解决问题的就是白底黑字

大马鱼哈

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
3
评论
pytesseract 提高印刷体数字识别率走的弯路白底黑字

屏幕截图里识别数字,非常正规的字体,但是识别率不高,反复实验后发现:图像要白底黑字白底黑字白底黑字重要的事情说三遍,凡是没有白底黑字的也能部分识别,但是效果惨不忍睹. height, width, deep = cropImg.shape # cropImg是从图片里截取的,只包含一行数字 gray = cv.cvtColor(cropImg, cv.COLOR_BGR2GRAY) # 转灰度图 ...
复制链接

扫一扫