python API识别图片之后运用爬虫对内容进行翻译--------实例：PDF英文文档翻译

本文链接：https://blog.csdn.net/qq_41058594/article/details/88303892

本文介绍了一种使用Python脚本结合百度API识别PDF中的英文内容，并进行翻译的方法。通过创建BaiDuAPI类，实现图片识别功能，并将识别后的文字输入Word文档。虽然存在一些小bug，作者计划进行优化并提高识别准确率，同时欢迎读者提供反馈和建议。

摘要由CSDN通过智能技术生成

前几天由于没钱了想挣点外快，经同学介绍，有个打字接单挣钱的，于是乎我就加进去，做了两三天，也就挣了50多，第一次是手写的，纯手动打字，表示很累！最后我就灵机一动，写个脚本吧，用python脚本来帮我识别其内容，然后输入到world文件里边，并设置好字体，字体大小…
该过程是这样的
首先导入类，把前提准备好：

import configparser # 配置文件模块 读写配置文件
import docx
from aip import AipOcr # 文字识别模块
from docx.shared import Pt

全局变量：

QQname = input('请输入你要输入的QQname：') 
number = input('请输入你要输入的number：') 
time = input('请输入你要输入的time：') 
money = input('请输入你要输入的money：') 
ceshi = []
start = []

我采用的是百度的图片内容识别api：
没有app_id，api_key，secret_key的得去百度注册获得：

并用记事本制作启动文件passwd.ini：
在这里插入图片描述
保存该文件，然后打开pycharm或者你的python的idle来编写代码：
构建类 BaiDuAPI 来规范代码：

class BaiDuAPI(object):
    #特殊 构造函数 初始化函数
    def __init__(self,filePath):
        target = configparser.ConfigParser()
        target.read(filePath,encoding='utf-8-sig')
        app_id = target.get('工单密码','APP_ID')
        api_key = target.get('工单密码', 'API_KEY')
        secret_key = target.get('工单密码', 'SECRET_KEY')
        self.client = AipOcr(app_id,api_key,secret_key)

识别后输出内容到 world：

    def picture2Text(self,filePath):
        # 读取图片
        images = self.getPicture(filePath)
        texts = self.client.basicGeneral(images)
        file=docx.Document()
        file.styles['Normal'].font.name = u'宋体'
        file.styles['Normal'].font.size = Pt(10.5)#五号字体
        for word in texts['words_result']:
            
            paragraph = file.add_paragraph(word.get('words',''))           
            ph_format =paragraph.paragraph_format
            ph_format.l