python调用讯飞语音合成API接口实现文字转语音，然后转换音频格式_python pcm转mp3

本文链接：https://blog.csdn.net/2401_84140428/article/details/138354690

    # 公共参数(common)
    self.CommonArgs = {"app_id": self.APPID}
    # 业务参数(business)，更多个性化参数可在官网查看
    self.BusinessArgs = {"aue": "raw", "auf": "audio/L16;rate=16000", "vcn": "xiaoyan", "tte": "utf8"}
    self.Data = {"status": 2, "text": str(base64.b64encode(self.Text.encode('utf-8')), "UTF8")}
    #使用小语种须使用以下方式，此处的unicode指的是 utf16小端的编码方式，即"UTF-16LE"”
    #self.Data = {"status": 2, "text": str(base64.b64encode(self.Text.encode('utf-16')), "UTF8")}

# 生成url
def create_url(self):
    url = 'wss://tts-api.xfyun.cn/v2/tts'
    # 生成RFC1123格式的时间戳
    now = datetime.now()
    date = format_date_time(mktime(now.timetuple()))

    # 拼接字符串
    signature_origin = "host: " + "ws-api.xfyun.cn" + "\n"
    signature_origin += "date: " + date + "\n"
    signature_origin += "GET " + "/v2/tts " + "HTTP/1.1"
    # 进行hmac-sha256进行加密
    signature_sha = hmac.new(self.APISecret.encode('utf-8'), signature_origin.encode('utf-8'),
                             digestmod=hashlib.sha256).digest()
    signature_sha = base64.b64encode(signature_sha).decode(encoding='utf-8')

    authorization_origin = "api_key=\"%s\", algorithm=\"%s\", headers=\"%s\", signature=\"%s\"" % (
        self.APIKey, "hmac-sha256", "host date request-line", signature_sha)
    authorization = base64.b64encode(authorization_origin.encode('utf-8')).decode(encoding='utf-8')
    # 将请求的鉴权参数组合为字典
    v = {
        "authorization": authorization,
        "date": date,
        "host": "ws-api.xfyun.cn"
    }
    # 拼接鉴权参数，生成url
    url = url + '?' + urlencode(v)
    # print("date: ",date)
    # print("v: ",v)
    # 此处打印出建立连接时候的url,参考本demo的时候可取消上方打印的注释，比对相同参数时生成的url与自己代码生成的url是否一致
    # print('websocket url :', url)
    return url

def on_message(ws, message):
try:
message =json.loads(message)
code = message[“code”]
sid = message[“sid”]
audio = message[“data”][“audio”]
audio = base64.b64decode(audio)
status = message[“data”][“status”]
print(message)
if status == 2:
print(“ws is closed”)
ws.close()
if code != 0:
errMsg = message[“message”]
print(“sid:%s call error:%s code is:%s” % (sid, errMsg, code))
else:

        with open('./demo.pcm', 'ab') as f:
            f.write(audio)

except Exception as e:
    print("receive msg,but parse exception:", e)

收到websocket错误的处理

def on_error(ws, error):
print(“### error:”, error)

收到websocket关闭的处理

def on_close(ws):
print(“### closed ###”)

收到websocket连接建立的处理

def on_open(ws):
def run(*args):
d = {“common”: wsParam.CommonArgs,
“business”: wsParam.BusinessArgs,
“data”: wsParam.Data,
}
d = json.dumps(d)
print(“------>开始发送文本数据”)
ws.send(d)
if os.path.exists(‘./demo.pcm’):
os.remove(‘./demo.pcm’)

thread.start_new_thread(run, ())

if name == “main”:
# 测试时候在此处正确填写相关信息即可运行
wsParam = Ws_Param(APPID=‘你的APPID’, APISecret=‘你的APISecret’,
APIKey=‘你的APIKey’,
Text=“轮播广告可在店铺首页展示图片类型的轮播广告，引导用户关注新品爆品、领取优惠券、或是招募推荐官。”)
websocket.enableTrace(False)
wsUrl = wsParam.create_url()
ws = websocket.WebSocketApp(wsUrl, on_message=on_message, on_error=on_error, on_close=on_close)
ws.on_open = on_open
ws.run_forever(sslopt={“cert_reqs”: ssl.CERT_NONE})


六、官方demo的代码，默认生成的音频是.pcm格式，如果需要转为wav格式请使用如下方法

import wave

def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
# 打开 PCM 文件
pcmf = open(pcm_file, ‘rb’)
pcmdata = pcmf.read()
pcmf.close()

# 打开将要写入的 WAVE 文件
wavfile = wave.open(wav_file, 'wb')
# 设置声道数
wavfile.setnchannels(channels)
# 设置采样位宽
wavfile.setsampwidth(bits // 8)
# 设置采样率
wavfile.setframerate(sample_rate)
# 写入 data 部分
wavfile.writeframes(pcmdata)
wavfile.close()

if name==“main”:
pcm2wav(“demo.pcm”, “demo.wav”)


七、如果你需要将音频转为mp3格式，请使用如下代码将wav格式转为mp3格式。


注意，安装pydub之前需要下载ffmpeg，并将其bin目录添加到环境变量，重启编辑器。


ffmpeg官方网站：[FFmpeg](https://bbs.csdn.net/topics/618317507)，下载速度慢，可用我分享的老版本。


如果你也是看准了Python，想自学Python，在这里为大家准备了丰厚的免费**学习**大礼包，带大家一起学习，给大家剖析Python兼职、就业行情前景的这些事儿。



### 一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。



![](https://img-blog.csdnimg.cn/img_convert/9f49b566129f47b8a67243c1008edf79.png)

### 二、学习软件



工欲善其必先利其器。学习Python常用的开发软件都在这里了，给大家节省了很多时间。



![](https://img-blog.csdnimg.cn/img_convert/8c4513c1a906b72cbf93031e6781512b.png)



### 三、全套PDF电子书

书籍的好处就在于权威和体系健全，刚开始学习的时候你可以只看视频或者听某个人讲课，但等你学完之后，你觉得你掌握了，这时候建议还是得去看一下书籍，看权威技术书籍也是每个程序员必经之路。

![](https://img-blog.csdnimg.cn/img_convert/eec417a3d4d977b313558a11d3c13e43.png)



### 四、入门学习视频

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。



![](https://img-blog.csdnimg.cn/img_convert/ec690501ea1dbe2cb209cbf4013c2477.png)  

![](https://img-blog.csdnimg.cn/img_convert/3eaeaa6747419c9d86c72e0d10d0a6a2.png)



### 四、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。



![](https://img-blog.csdnimg.cn/img_convert/252731a671c1fb70aad5355a2c5eeff0.png)



### 五、面试资料

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

![](https://img-blog.csdnimg.cn/img_convert/6c361282296f86381401c05e862fe4e9.png)

成为一个Python程序员专家或许需要花费数年时间，但是打下坚实的基础只要几周就可以，如果你按照我提供的学习路线以及资料有意识地去实践，你就有很大可能成功！
最后祝你好运！！！




**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友，可以戳这里无偿获取](https://bbs.csdn.net/topics/618317507)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**