关于语音识别技术的一个简单应用

最新推荐文章于 2024-08-10 10:46:00 发布

2301_80170269

最新推荐文章于 2024-08-10 10:46:00 发布

阅读量317

点赞数 4

文章标签： python 开发语言

本文链接：https://blog.csdn.net/2301_80170269/article/details/138031051

版权

本文介绍了如何使用Python中的AipSpeech库，通过百度AI的API将文本转换成语音，包括设置参数和处理可能出现的错误。开发者通过提供自己的APP_ID、API_KEY和SECRET_KEY来调用语音合成功能，生成MP3文件。

摘要由CSDN通过智能技术生成

from aip import AipSpeech

# 你的APPID AK SK
APP_ID = '62469330'
API_KEY = '4EupnfTt2j35mbRcms7yoADt'
SECRET_KEY = 'iBIFa0ChCzwRSpQDZFY4NCMeZiRikCI2'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

text = '欢迎来到赣南医科大学黄金校区2023届智能医学工程本科二班'  # 文字部分也可以从磁盘读取，或者是从图片中识别
filePath = "MyVoice.mp3"  # 音频文件存放路径


result = client.synthesis(text, 'zh', 1, {'vol': 5})

if isinstance(result, dict):  # 如果result是字典，说明有错误发生
    print("错误:", result.get("error_msg"))
else:
    with open(filePath, 'wb') as f:  # 以写的方式打开MyVoice.mp3文件
        f.write(result)  # 将result内容写入MyVoice.mp3文件
    print("语音文件已成功保存为:", filePath)

以下为完成以上代码的流程，以供参考。

jupyter notebook 更改默认存储路径和在指定文件夹下打开的方法 - 知乎 (zhihu.com) 语音识别实验一、登录百度AI开放平台-全球领先的人工智能服务平台 (baidu.com) 百度AI开放平台-全球领先的人工智能服务平台

记录以上信息，APPID,APIKEY,SECRET KEY 在代码中修改为自己的KEY

代码：

从AIP中导入相应的语音模块AipSpeech

from aip import AipSpeech

复制粘贴APPID、AK、SK这3个值并以此初始化对象

"""你的APPID AK SK""" APP_ID='59362217' API_KEY='xeUuWoq3oYvJ4o4Wo8tyAtiw' SECRET_KEY='FrxRUcd2i43vnc5Jq9kQhdkATgk4RdfE' client=AipSpeech (APP_ID, API_KEY, SECRET_KEY)

准备文本及存放路径

Text='欢迎来到赣南医科大学' # 文字部分也可以从磁盘读取，或者是从图片中识别 filePath= "MyVoice.mp3 " #音频文件存放路径

语音合成

result=client.synthesis (Text,'zh',1, {'vol': 5}) print(result)

可以做一些个性化设置，如选择音量、发音人、语速等

识别并正确返回语音二进制代码,错误则返回dict（相应的错误码）

if not isinstance (result, dict): with open (filePath,'wb')as f: # 以写的方式打开MyVoice.mp3文件 f.write(result) # 将result内容写入MyVoice.mp3文件 else: print("错误")

2301_80170269

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
4
评论
关于语音识别技术的一个简单应用

以下为完成以上代码的流程，以供参考。jupyter notebook 更改默认存储路径和在指定文件夹下打开的方法 - 知乎 (zhihu.com) 语音识别实验一、登录百度AI开放平台-全球领先的人工智能服务平台 (baidu.com)记录以上信息，APPID,APIKEY,SECRET KEY 在代码中修改为自己的KEY。
复制链接

扫一扫