python API识别图片之后运用爬虫对内容进行翻译--------实例:PDF英文文档翻译

本文介绍了一种使用Python脚本结合百度API识别PDF中的英文内容,并进行翻译的方法。通过创建BaiDuAPI类,实现图片识别功能,并将识别后的文字输入Word文档。虽然存在一些小bug,作者计划进行优化并提高识别准确率,同时欢迎读者提供反馈和建议。
摘要由CSDN通过智能技术生成

前几天由于没钱了想挣点外快,经同学介绍,有个打字接单挣钱的,于是乎我就加进去,做了两三天,也就挣了50多,第一次是手写的,纯手动打字,表示很累!最后我就灵机一动,写个脚本吧,用python脚本来帮我识别其内容,然后输入到world文件里边,并设置好字体,字体大小…
该过程是这样的
首先导入类,把前提准备好:

import configparser # 配置文件模块 读写配置文件
import docx
from aip import AipOcr # 文字识别模块
from docx.shared import Pt

全局变量:

QQname = input('请输入你要输入的QQname:') 
number = input('请输入你要输入的number:') 
time = input('请输入你要输入的time:') 
money = input('请输入你要输入的money:') 
ceshi = []
start = []

我采用的是百度的图片内容识别api:
没有app_id,api_key,secret_key的得去百度注册获得:

并用记事本制作启动文件passwd.ini
在这里插入图片描述
保存该文件,然后打开pycharm或者你的python的idle来编写代码:
构建类 BaiDuAPI 来规范代码:

class BaiDuAPI(object):
    #特殊 构造函数 初始化函数
    def __init__(self,filePath):
        target = configparser.ConfigParser()
        target.read(filePath,encoding='utf-8-sig')
        app_id = target.get('工单密码','APP_ID')
        api_key = target.get('工单密码', 'API_KEY')
        secret_key = target.get('工单密码', 'SECRET_KEY')
        self.client = AipOcr(app_id,api_key,secret_key)

识别后输出内容到 world:

    def picture2Text(self,filePath):
        # 读取图片
        images = self.getPicture(filePath)
        texts = self.client.basicGeneral(images)
        file=docx.Document()
        file.styles['Normal'].font.name = u'宋体'
        file.styles['Normal'].font.size = Pt(10.5)#五号字体
        for word in texts['words_result']:
            
            paragraph = file.add_paragraph(word.get('words',''))           
            ph_format =paragraph.paragraph_format
            ph_format.l
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暗香独自开

你的鼓励是我总结的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值