阿里云语音合成使用流程完全记录

一.申请阿里云的key和appkey。

因为我已经申请完了,所以直接从网上找个流程,粘贴到这里。如下

语音试听地址:https://ai.aliyun.com/nls/tts

当然也可点击文章头部的语音,看看是否你需要的类型。
注册阿里云这些步骤,我就省略了啊。

阿里云官网:https://cn.aliyun.com/
第一步

1、注册之后点击链接进入控制台:

https://nls-portal.console.aliyun.com/overview

会提醒你开通语音合成,点击即可

 

2、进入控制台创建一个项目——点击总览或全部项目——【创建项目】

 

3、创建之后记得保存——appkey至文本,后面会用到

二.安装python SDK

按照下面页面指示进行。

https://help.aliyun.com/document_detail/120699.html?spm=a2c4g.11186623.6.594.22a42bc0iltYNk

在python setup.py install的时候,会遇到下面的错误。

命令行上面内容省略。。。

Installed c:\users\administrator\appdata\local\programs\python\python36\lib\site-packages\alibabacloud_nls_java_sdk-2.0.0-py3.6.egg
Processing dependencies for alibabacloud-nls-java-sdk==2.0.0
Searching for websocket-client
Reading https://pypi.python.org/simple/websocket-client/
Download error on https://pypi.python.org/simple/websocket-client/: timed out -- Some packages may not be found!
Couldn't find index page for 'websocket-client' (maybe misspelled?)
Scanning index of all packages (this may take a while)
Reading https://pypi.python.org/simple/
Download error on https://pypi.python.org/simple/: timed out -- Some packages may not be found!
No local packages or working download links found for websocket-client
error: Could not find suitable distribution for Requirement.parse('websocket-client')

解决办法是运行  

pip install incremental==17.5.0

再运行就没有错误了。成功安装。

像下面这样是安装成功了。

修改示例代码,在文章的最下面。

运行出现错误。


G:\vscode_python\语音合成>C:/Users/Administrator/AppData/Local/Programs/Python/Python36/python.exe g:/vscode_python/语音合成/make_audio.py
2020-06-29 18:24:39,921 alispeech-WARNING  _on_error:123 retry start: [WinError 10042] 在 getsockopt 或 setsockopt 调用中指定的一个未知的、无
效的或不受支持的选项或层次。
MyCallback.OnRecognitionChannelClosed
2020-06-29 18:24:50,268 alispeech-WARNING  _on_error:123 retry start: [WinError 10042] 在 getsockopt 或 setsockopt 调用中指定的一个未知的、无
效的或不受支持的选项或层次。
MyCallback.OnRecognitionChannelClosed
2020-06-29 18:25:00,575 alispeech-ERROR  _on_error:115 [WinError 10042] 在 getsockopt 或 setsockopt 调用中指定的一个未知的、无效的或不受支持
的选项或层次。
MyCallback.OnRecognitionTaskFailed-task_id:0, status_text:[WinError 10042] 在 getsockopt 或 setsockopt 调用中指定的一个未知的、无效的或不受支
持的选项或层次。
MyCallback.OnRecognitionChannelClosed
2020-06-29 18:25:00,584 alispeech-ERROR  start:156 start failed, status: 6

查了很久,发现是python版本的问题。

https://stackoverflow.com/questions/47962516/python-error-10042-pusher-websocket

I saw the same error using a different library that uses websockets. I can see from your description (and link) that Pysher uses websockets.

I found (yet another) websocket client for Python that reported an issue with websockets, specifically with Python 3.6.4: [https://github.com/websocket-client/websocket-client/issues/370]

It references the bug in Python tracker as well [https://bugs.python.org/issue32394]

Upgrading to Python 3.6.5 worked for me. Alternatively, they suggest that upgrading to Windows 10 1703+ should work too (just for completeness; I have not verified this).

所以,不要用python3.6.4  ,后来我下载安装了python3.8.就可以正常运行了。

demo代码如下:

# -*- coding: utf-8 -*-
import threading
import ali_speech
from ali_speech.callbacks import SpeechSynthesizerCallback
from ali_speech.constant import TTSFormat
from ali_speech.constant import TTSSampleRate

class MyCallback(SpeechSynthesizerCallback):
    # 参数name用于指定保存音频的文件
    def __init__(self, name):
        self._name = name
        self._fout = open(name, 'wb')
    def on_binary_data_received(self, raw):
        print('MyCallback.on_binary_data_received: %s' % len(raw))
        self._fout.write(raw)
    def on_completed(self, message):
        print('MyCallback.OnRecognitionCompleted: %s' % message)
        self._fout.close()
    def on_task_failed(self, message):
        print('MyCallback.OnRecognitionTaskFailed-task_id:%s, status_text:%s' % (
            message['header']['task_id'], message['header']['status_text']))
        self._fout.close()
    def on_channel_closed(self):
        print('MyCallback.OnRecognitionChannelClosed')


def process(client, appkey, token, text, audio_name, voice):
    callback = MyCallback(audio_name)
    synthesizer = client.create_synthesizer(callback)
    synthesizer.set_appkey(appkey)
    synthesizer.set_token(token)
    synthesizer.set_voice(voice)
    synthesizer.set_text(text)
    synthesizer.set_format(TTSFormat.WAV)
    synthesizer.set_sample_rate(TTSSampleRate.SAMPLE_RATE_16K)
    synthesizer.set_volume(50)
    synthesizer.set_speech_rate(-200)
    synthesizer.set_pitch_rate(0)
    try:
        ret = synthesizer.start()
        if ret < 0:
            return ret
        synthesizer.wait_completed()
    except Exception as e:
        print(e)
    finally:
        synthesizer.close()

def process_multithread(client, appkey, token, number):
    thread_list = []
    for i in range(0, number):
        text = "这是线程" + str(i) + "的合成。"
        audio_name = "sy_audio_" + str(i) + ".wav"
        thread = threading.Thread(target=process, args=(client, appkey, token, text, audio_name, voice))
        thread_list.append(thread)
        thread.start()
    for thread in thread_list:
        thread.join()

if __name__ == "__main__":
    client = ali_speech.NlsClient()
    # 设置输出日志信息的级别:DEBUG、INFO、WARNING、ERROR
    client.set_log_level('INFO')
    voice = 'AiDa'
    appkey = '你自己的appkey'
    token = '你自己的token'
    text = "这里是测试的文字。"
    audio_name = 'sy_audio.wav'
    process(client, appkey, token, text, audio_name, voice)
    # 多线程示例
    # process_multithread(client, appkey, token, 2)

还有一个需要补充的是,帮助里面说java sdk是可以获取生成的语音的时间戳的。但是没有提Python。

自己找也没有找到相应的函数。

其他扩展资料:

网上高手用pyqt5写的语音合成:

https://github.com/NH4L/voiceAssistant/tree/6dfcba16a644e7e1f9f67e7ce3eddeafd565c7dc

 

 

 

 

### 关于面包板电源模块 MB102 的 USB 供电规格及兼容性 #### 1. **MB102 基本功能** 面包板电源模块 MB102 是一种常见的实验工具,主要用于为基于面包板的小型电子项目提供稳定的电压输出。它通常具有两路独立的稳压输出:一路为 5V 和另一路可调电压(一般范围为 3V 至 12V)。这种设计使得它可以满足多种芯片和传感器的不同工作电压需求。 #### 2. **USB 供电方式** MB102 支持通过 USB 接口供电,输入电压通常是标准的 5V DC[^1]。由于其内部集成了 LM7805 稳压器以及可调节电位器控制的直流-直流变换电路,因此即使输入来自电脑或其他低功率 USB 设备,也能稳定地向负载供应电力。不过需要注意的是,如果项目的功耗较高,则可能超出某些 USB 端口的最大电流能力(一般是 500mA),从而引起不稳定现象或者保护机制启动断开连接的情况发生。 #### 3. **兼容性分析** 该型号广泛适用于各种微控制器单元 (MCU),特别是那些像 Wemos D1 R32 这样可以通过杜邦线轻松接入并共享相同逻辑级别的系统[^2]。另外,在提到 Arduino Uno 板时也表明了良好的互操作性,因为两者均采用相似的标准接口定义与电气特性参数设置[^4]: - 对于需要 3.3V 工作环境下的组件来说,只需调整好对应跳线帽位置即可实现精准匹配; - 当涉及到更多外围扩展应用场合下,例如带有多重模拟信号采集任务的情形里,利用 MB102 提供干净无干扰的基础能源供给就显得尤为重要了[^3]。 综上所述,对于打算构建以单片机为核心的原型验证平台而言,选用具备良好声誉记录且易于获取配件支持服务链路上下游资源丰富的品牌产品——如这里讨论过的这款特定类型的配电装置不失为明智之举之一。 ```python # 示例 Python 代码展示如何检测硬件状态 import machine pin = machine.Pin(2, machine.Pin.IN) if pin.value() == 1: print("Power supply is stable.") else: print("Check your connections and power source.") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值