关于使用mac搭建tesseract-ocr的血泪总结

1.使用pyhton安装pytesseract

2.使用brew 安装tesseract

3.将pytesseract包的里的pytesseract.py 中的

tesseract_cmd的路径换成brew 安装的tesseract包的安装目录。

这样才能一次性成功。 

 完整源码

import pytesseract
from PIL import Image
import pymysql
from coverage.annotate import os

# 建立数据库连接
conn = pymysql.connect(
    host='localhost',
    port=3306,
    user='root',
    password='root',
    db='cut_movie',
    charset='utf8'
)

# 获取游标
cursor = conn.cursor()

# 执行sql语句
sql = 'select * from frame'
rows = cursor.execute(sql)  # 返回结果是受影响的行数
data = cursor.fetchall()
for row in data:
    id = row[0]
    va = row[1] + ""
    # va = va.replace("/Users/zhangjunhua/Movies/young/vedio/", "/Users/zhangjunhua/Movies/young/cut_video/")
    if not os.path.exists(va):
        print("文件不存在")
        continue
    data = Image.open(va)

    res = pytesseract.image_to_string(data, lang='chi_sim')
    print(res)
    if not res:
        res = "无"
    else:
        res = ','.join(res[0])
    print(res)
    if res != '' or res != '无':
        sta = 0
    else:
        sta = 1
    sql1 = 'UPDATE frame SET va="%s",status=%s WHERE id=%s'
    val = (res,sta,id)
    cursor.execute(sql1,val)
    conn.commit()
# 关闭游标
cursor.close()

# 关闭连接
conn.close()

你想了解关于在PyCharm中使用PythonTesseract-OCR吗?要使用Tesseract-OCR,你需要安装tesseract-ocr库和pytesseract库。 首先,你需要安装Tesseract-OCR。根据你的操作系统,你可以通过以下方式安装: 对于Windows用户: 1. 访问https://github.com/UB-Mannheim/tesseract/wiki下载Tesseract-OCR安装文件。 2. 执行安装文件,并按照安装向导的指示进行安装。 对于Mac用户: 1. 使用Homebrew安装Tesseract-OCR。在终端中输入以下命令: ``` brew install tesseract ``` 2. 安装完成后,Tesseract-OCR会自动添加到你的系统路径中。 对于Linux用户: 1. 打开终端,并根据你的Linux发行版输入以下命令来安装Tesseract-OCR: ``` sudo apt-get install tesseract-ocr ``` 或者 ``` sudo yum install tesseract ``` 安装完成后,确保Tesseract-OCR已正确配置并能在终端中使用。你可以在终端中运行以下命令来测试: ``` tesseract --version ``` 接下来,你需要在PyCharm中安装pytesseract库。可以通过以下步骤完成: 1. 打开PyCharm,并创建一个新的Python项目。 2. 在PyCharm的终端中运行以下命令,安装pytesseract: ``` pip install pytesseract ``` 3. 安装完成后,你可以开始在PyCharm中使用pytesseract库来使用Tesseract-OCR了。 下面是一个简单的示例代码,演示如何在PyCharm中使用pytesseract库进行图像文字识别: ```python import pytesseract from PIL import Image # 打开图像 image = Image.open('image.jpg') # 使用pytesseract进行文字识别 text = pytesseract.image_to_string(image) # 输出识别结果 print(text) ``` 确保将上述示例中的'image.jpg'替换为你要识别的图像路径。 希望这能帮到你!如果你有其他问题,请随时问我。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值