关于语音识别技术的一个简单应用

本文介绍了如何使用Python中的AipSpeech库,通过百度AI的API将文本转换成语音,包括设置参数和处理可能出现的错误。开发者通过提供自己的APP_ID、API_KEY和SECRET_KEY来调用语音合成功能,生成MP3文件。
摘要由CSDN通过智能技术生成
from aip import AipSpeech

# 你的APPID AK SK
APP_ID = '62469330'
API_KEY = '4EupnfTt2j35mbRcms7yoADt'
SECRET_KEY = 'iBIFa0ChCzwRSpQDZFY4NCMeZiRikCI2'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

text = '欢迎来到赣南医科大学黄金校区2023届智能医学工程本科二班'  # 文字部分也可以从磁盘读取,或者是从图片中识别
filePath = "MyVoice.mp3"  # 音频文件存放路径


result = client.synthesis(text, 'zh', 1, {'vol': 5})

if isinstance(result, dict):  # 如果result是字典,说明有错误发生
    print("错误:", result.get("error_msg"))
else:
    with open(filePath, 'wb') as f:  # 以写的方式打开MyVoice.mp3文件
        f.write(result)  # 将result内容写入MyVoice.mp3文件
    print("语音文件已成功保存为:", filePath)

以下为完成以上代码的流程,以供参考。

jupyter notebook 更改默认存储路径和在指定文件夹下打开的方法 - 知乎 (zhihu.com) 语音识别实验 一、 登录百度AI开放平台-全球领先的人工智能服务平台 (baidu.com) 百度AI开放平台-全球领先的人工智能服务平台

,

,

,

,

,

,

,

记录以上信息,APPID,APIKEY,SECRET KEY 在代码中修改为自己的KEY

代码:

从AIP中导入相应的语音模块AipSpeech

from aip import AipSpeech

复制粘贴APPID、AK、SK这3个值并以此初始化对象

"""你的APPID AK SK""" APP_ID='59362217' API_KEY='xeUuWoq3oYvJ4o4Wo8tyAtiw' SECRET_KEY='FrxRUcd2i43vnc5Jq9kQhdkATgk4RdfE' client=AipSpeech (APP_ID, API_KEY, SECRET_KEY)

准备文本及存放路径

Text='欢迎来到赣南医科大学' # 文字部分也可以从磁盘读取,或者是从图片中识别 filePath= "MyVoice.mp3 " #音频文件存放路径

语音合成

result=client.synthesis (Text,'zh',1, {'vol': 5}) print(result)

可以做一些个性化设置,如选择音量、发音人、语速等

识别并正确返回语音二进制代码,错误则返回dict(相应的错误码)

if not isinstance (result, dict): with open (filePath,'wb')as f: # 以写的方式打开MyVoice.mp3文件 f.write(result) # 将result内容写入MyVoice.mp3文件 else: print("错误")

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值