最近工作实在太忙了,没有空更新博客和公众号,还请大家谅解~
I'm back!
前几天刚好一个同事老大哥找到我,需要紧急将一份ppt上的文字转成语音,ppt大概有20多页,每页去录很明显不现实。
在经调研之后,我还是选择了百度大脑的产品,使用之后的感觉,真香~
我使用的是“百度大脑 AI开放平台”的(在线)语音合成产品,参考API文档请访问:
https://ai.baidu.com/ai-doc/SPEECH/Gk4nlz8tc
首先需要在电脑上安装python环境,我采用的是3.5,使用pip安装百度AI库
pip install baidu-aip
然后去百度智能云(https://cloud.baidu.com/)去申请免费的语音技术产品
随后创建一个应用
在创建好应用后,别忘记领取下免费额度,要不然产品是无法使用的!(我这里已经领好了)
然后就可以写代码了,demo如下:
# coding=utf-8
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = ''
API_KEY = ''
SECRET_KEY = ''
# https://ai.baidu.com/ai-doc/SPEECH/Gk4nlz8tc
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis(
'网络安全是什么。你们遇到过以下这些问题吗?例1:上网正在兴头上的时候,突然IE浏览器窗口不停地打开,直到资源耗尽死机?'
'例2:QQ被盗了,黑客公开售卖200元,最后费尽周折,利用密码保护才找回了心爱的QQ号,但是里面的好友和群全部被删除。'
'例3:经常性收到各类垃圾短信。互联网安全。之前,支付宝因“光纤被挖断”中断服务数小时,携程网因“错误操作”系统瘫痪近12小时,各大券商网站也“一时拥堵”造成集体登录失败。'
'支付宝钱没了,不能转账;股票登陆不了,影响交易……宕机事件给人们带来诸多不便,让很多人意识到网络安全与每个人的生活如此相关。当你接入一个叫“Starbucks”的WiFi时,你无法确认这是星巴克提供的,还是猩疤客提供的。', 'zh', 1, {
'vol': 5,'per':1,'spd':4
})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
with open('./auido.mp3', 'wb') as f:
f.write(result)