百度AI技术

本文介绍了如何利用百度AI的接口进行语音合成和识别。首先,需要在ai.baidu.com注册并创建应用获取参数。对于语音合成,通过Python的baidu-aip SDK进行操作,注意文本长度限制。在语音识别方面,同样使用SDK,支持多种格式的原始录音,但时长不超过60s。此外,还提及了文本相似度处理的基础步骤。
摘要由CSDN通过智能技术生成

利用百度提供接口,实现智能语音

语音合成  -- TTS(text to speech)

注册

ai.baidu.com 页面中点击 控制台 ,弹出登陆 / 注册页面

创建应用

登陆成功后,点击左侧的语音技术。

跳转页面后。点击创建应用,按照对应的提示填写

想用python 操作,需要下载 baidu-aip

  • 如果已安装pip,执行pip install baidu-aip即可。
  • 如果已安装setuptools,执行python setup.py install即可。

新建AipSpeech

AipSpeech是语音识别的Python SDK客户端,为使用语音识别的开发人员提供了一系列的交互方法。

参考如下代码新建一个AipSpeech:

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

在 应用列表 中点击 需要的应用 。会查看到你需要的参数

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '16815867'
API_KEY = 'NyIrwuFvSfp8oAgN1cK0GGXE'
SECRET_KEY = 'sDY2EVkirZLBfIcOPfffoWKVUBP2ONZx'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis('你好呀,我的朋友', 'zh', 1, {
    'vol': 5,
})

# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
    with open('auido.mp3', 'wb') as f:
        f.write(result)

支持Python版本:2.7.+ ,3.+

合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制

 

错误返回格式

若请求错误,服务器将返回的JSON文本包含以下参数:

  • error_code:错误码。
  • error_msg:错误描述信息,帮助理解和解决发生的错误。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值