opencv python3 文本区域识别_使用等高线从图像中提取文本区域 - Opencv,Python

我一直在使用python中的opencv开发名片的OCR项目 .

直到现在,我已经能够裁剪图像卡 . 我试图使用轮廓检测裁剪图像中的文本区域 . (即,拍摄Canny图像,从这些边缘找到轮廓并将它们扩大以获得连接的组件,这些组件必须是文本区域) .

当我试图检测闭合的连接组件时,一些轮廓覆盖了除文本之外的额外部分(如符号),如this图像 .

因此,在这些文本区域上应用tesseract-ocr会产生不需要的文本(垃圾)以及所需的文本 . 这是我的OCR的结果 .

**(P)(972)656-6074

(F)(972)656-6077

(M)(214)505-8473

5910 N.中央高速公路,Suite1625»

达拉斯,得克萨斯州75206

ken.shulman@capviewpartners.com

WKW™/”

CAPVIEW

EPARTNERS

Ken Shulman,CRE

伙伴**

我尝试修改扩张因子,但图像中符号的一部分总是成为文本区域的一部分 .

我想尽可能优化预处理,以便tesseract-ocr不会出错 . 那么如何从文本区域中删除那些额外的部分(符号)还是有另一种方法?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值