linux调用百度接口ocr快速准确提取图片中文字

最新推荐文章于 2024-03-02 21:15:00 发布

solejay

最新推荐文章于 2024-03-02 21:15:00 发布

阅读量1.1k

点赞数 2

分类专栏： Python 文章标签： python linux ocr

本文链接：https://blog.csdn.net/m0_37991005/article/details/105643446

版权

Python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

有些 pdf 文档没办法复制句子，有些图片上的字想弄下来却不想手敲，一直打算看看有什么好用的 ocr 软件，Windows 上曾用过天若很好用，但是 linux 上没看到很好的现成软件，在网上搜索之后决定调用百度接口写一个脚本实现文字识别。

安装 OCR Python SDK

pip3 install baidu-aip

注册百度智能云获得 APPID AK SK

注册并登陆进入百度智能云，在产品服务中进入文字识别模块

在这里插入图片描述

点击创建应用填写内容后可以看到自己申请的 appid ak sk

在这里插入图片描述

编写脚本调用接口识别

# ocr.py

from aip import AipOcr
import json
import sys


""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()


if __name__ == "__main__":

    """ 你的 APPID AK SK """
    APP_ID = '你的 appid'
    API_KEY = '你的 ak'
    SECRET_KEY = '你的 sk'

    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

    image = get_file_content(sys.argv[1])

    """ 调用通用文字识别, 图片参数为本地图片 """
    client.basicGeneral(image);

    """ 如果有可选参数 """
    options = {}
    options["language_type"] = "CHN_ENG"
    options["detect_direction"] = "false"
    options["detect_language"] = "true"
    options["probability"] = "false"

    """ 带参数调用通用文字识别, 图片参数为本地图片 """
    result = client.basicGeneral(image, options)

    text = ''
    for item in result['words_result']:
        text += item['words']
    print(text)

调用命令是 python3 ocr.py example.jpg。ocr.py 是脚本名称，example.jpg 是图片的名字。

在这里插入图片描述

优化使用

为了方便调用，编辑 .zshrc（用系统自带 bash 编辑 .bshrc），添加语句

alias ocr='python3 /home/solejay/Program/ocr.py'

这样，把图片保存到桌面，在桌面打开终端只需要输入 ocr 图片名 就可以了。

参考文档

百度官方 python 接口文档

solejay

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录