本节我们将介绍使用python识别一张图片中的内容,并试着得到一张表格,当然并不是类似于Excel的表格,而是该表格的markdown代码。
注:原创内容,转载请标明出处!
相关工具的安装
本次实验环境:win10,Pycharm2019.3。
安装相关库既可以使用命令行,也可以使用Pycharm自带的工具。
打开cmd命令行或者powershell。
首先安装PIL:
pip install Pillow

这是已经安装好PIL的示意图。
之后,安装pytesseract:
pip install pytesseract

这是已经安装好pytesseract的示意图。
接下来,安装Tesseract-OCR,注意对应系统。
环境配置,输入
tesseract
tesseract -v

如果正常输出,表示配置成功了(我在实际操作时,安装完成后自动配置了系统变量),如果没有,找到之前安装的路径:
例如:

G:\Program Files (x86)\Tesseract-OCR
将该路径添加到系统变量中

如果你想做英文之外的识别,Tesseract-OCR是没有带其他语言包的,你可以去下载其他语言包

本教程介绍如何使用Python结合PIL和pytesseract库识别图片中的表格内容,并将其转换为Markdown格式。首先安装PIL和pytesseract,然后安装Tesseract-OCR并配置环境。通过pytesseract.image_to_string()函数获取表格文字,再进行数据处理,生成Markdown表格。最终,程序将识别出的表格内容输出为Markdown文本。
最低0.47元/天 解锁文章
1831

被折叠的 条评论
为什么被折叠?



