这一年自学了Python,然后又学习了基于Python的界面程序框架PyQt5,本身自己也是写软件测评的,所以对市面上的刚需有所了解。
比如我发现市面上的音频转文字和PDF文章翻译这两项功能几乎都是收费的,而需求貌似也挺大。
所以呢,就用学到的PyQt5与百度免费的API相结合,写出了两款小工具,通过在吾爱破解论坛上的热度可以看到,这两项功能确实挺受欢迎的。
软件完全免费,缺点就是有些未知bug,我也根据这半年来很多网友的反馈进行改进和解答,两个工具的文章往期写过,今天完善修葺下。
「万能君的工具箱」
提取码:hbjv
目前的功能如下软件主界面所示,功能也都是按钮写的了:语音转文字、文字转语音、截图文字识别(附带图片批量识别)、复制文字翻译、图种制作这几个功能。
其实,一开始主要就是想做个语音转文字就行了,后来就做的多了,都是本着学习去的,主体功能还是语音转文字吧。
语音转文字目前市面上的音频转文字大多收费。
音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。
PS1:如果音频时长过大,有时候会出现网络堵塞卡住的现象,建议先用格式工厂将音频切割成半小时一段较为合适。
PS2:有时候部分码率的mp3转换不了,用格式工厂重新转换成mp3即可。
如下可识别普通话、英文、粤语和四川话,批量选取音频文件即可进行文字转写,不限时长,免费,识别速度尚可,耐心等待。
来测试下效果,比如批量识别小学生课文:
比如识别长达五分钟的《荷塘月色》:
识别岳云鹏的相声:
文字转语音
这个没什么好说的,输入文字,选择发音人、语速、音调之类的,可试听,可生产mp3格式的音频文件。此功能bug较多,┭┮﹏┭┮。
截图文字识别
类似于天若OCR,点击截图按钮即可截图,自动弹出识别文字。如下动图演示,也是个初版,界面简陋。
此功能纯粹为了用Python编写一个截图模块,类似功能QQ截图等更加给力,新版QQ截图自带文字识别功能。
在截图OCR下拉按钮有个图片批量文字识别功能,这都属于OCR功能,简单粗暴,批量选择图片,即可识别所有图片中的文字。如下动图演示:
复制翻译
看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。这项功能还是有些用处的,bug还没发现。如下演示:
图种制作
这个很简单的小功能,就是将一张图和一个压缩文件合并成一个图片文件,这个生成的图片文件打开是一张图,如果后缀修改为zip,解压后就能看到原先的压缩文件,不做演示了。
由于软件调用的百度AI接口,所以API接口的KEY需要各位申请,都是免费的哈。
如下,我们在主界面点击参数设置即可进入key的设置,想用哪个功能,就去百度AI申请即可。注意的就是填写的Key不要有额外的空格,一个都不能有哈。
比如需要语音转文字,我们就在百度语音识别主页,如下点击立即使用,登录百度账号如下所示。
然后如下点击创建应用。
然后如下只需要填写应用名称和应用描述即可,其他默认即可。
然后如下返回应用详情,就可以看到所需要的key啦,主要AppID、API Key、Secret Key三者别混了。
就是这么简单,其他服务创建也是一样,都是免费的,放心创建即可。
「万能君的文档翻译小工具」
这款软件解决的是文档翻译的需求,这种需求是比如将英文的PDF论文全部翻译成中文,而且最好排版不受影响。
如下主界面,软件也是基于免费的百度翻译接口,就是要自己申请哈,完全免费。支持翻译成中文、英语、汉语、文言文、俄语、韩语、繁体中文等。
PDF转Word
软件目前仅支持docx格式的Word文档翻译,所以如果各位需要翻译PDF文件(注意PDF文档为文字可复制的,扫描那种不支持),需要先转换成docx格式,而其实PDF转Word软件太多了。
比如强烈推荐我们经常用的Word就可以,自Word 2013以来,就支持PDF文档的打开。
如下动图,我们选择用Word 2016打开PDF文档,一路点是,然后另存为docx格式即可,生成的docx排版基本保留。这算是最简单的PDF转Word方式了。
PS:为何不支持直接PDF翻译?这个嘛,因为Python解析PDF确实挺费事,而解析docx却比较省事。
KEY的获取
虽说百度AI大会上李彦宏被浇水,但百度AI确实是个很良心的产品,提供了很多免费的接口。比如这个百度翻译接口,完全免费,我们就在百度翻译主页,如下点击立即使用,登录百度账号如下所示。
填写个人开发者相关信息,然后如下点击通用翻译API(我已经开通),创建应用,信息随便写就行。注意的是信息里的服务器地址不用填写,谨记谨记;还有申请标准版翻译接口即可,完全免费。
然后如下页面底部就可以看到所需要的key啦,主要AppID、密钥(Secret Key)二者别混了。
开始翻译文档
经过上文,我们docx文档也有了,key也填写了,然后我们选择目标翻译语言和模式即可,双语对照模式就是翻译好的文档,原文与翻译一一对应,比较适合阅读学习,单语言模式就是翻译语言一种了。
然后选择docx文档即可翻译,等待翻译完成,自当保存翻译好的文档于软件目录下,文件名字以translate开头。看看翻译效果,以两栏排版的论文效果为例,如下双语对照模式:
如下为单语言模式:
单语言模式bug有点多,推荐大家用双语对照翻译。
「小结」
好了,这两款工具也是心血之作,虽说有些bug,但还是挺有用的。