网上有很多策略,要么只能在 windows 系统上使用,要么就是从网络上调模型慢得很,这边提供一款在 macos 上使用 python 进行 OCR 的简单方法
brew 安装 tesseract:
- 这是因为你本地得有这个东西,才能用 python 调这个软件来进行OCR 处理
- 打开终端
- 输入:
brew install tesseract
即可
python 环境中安装 pytesseract 和 Pillow 库:
- pillow 是一个图像处理库
- pytesseract 是调用 tesseract 的
pip install pytesseract Pillow
代码
from PIL import Image
import pytesseract
def extract_text(image_path):
image = Image.open(image_path)
text = pytesseract.image_to_string(image)
return text
if __name__ == "__main__":
extracted_text = extract_text('图像路径...')
print(extracted_text)