虽然我没有声带, 但我可是会说话的

本期内容介绍:Audio 和 TTS

      人类是通过声带和空气流动来发声说话,那么模组开发板没有声带,是如何发声说话的呢?本周小编就给大家介绍 QuecPython 的音频功能 :Audio 和 TTS,只需要运行简的 QuecPython 代码,就可以实现音频播放,开发者还可以根据自己的需求定制和扩展这些功能,以满足特定的项目要求,实现没有声带也能说话的本领。那么接下来,小Q带大家一起来简单的实现如何用 QuecPython 播放声音!

 、硬件准备

首先,要进行基础的硬件准备,以 EC600N 和 EC600U 进行测试,各个型号支持通道不 同,请注意甄别,测试方法基本相同。

(1)对应音频通道

目前模组仅支持三种音频通道: 0 表示听筒, 1 表示耳机, 2 表示喇叭。

2)硬件连接

音频通道: 0 表示听筒, 1 表示耳机, 2 表示喇叭

 针对 EC600N_QuecPython_EVB_2.0 和 EC600N_QuecPython_EVB_3.1 ,对应的音频通道设置为听筒(0)的硬件连接图如下:喇叭接到开发板的 SPK- 、SPK+。

②针对 EC600U_QuecPython_EVB_2.0  对应的音频通道设置为听筒(0)的硬件连接图如下:喇叭接到开发板的 SPK- 、SPK+,另外短接 PIN40 引脚。

  针对 EC600U_QuecPython_EVB_2.0 对应的音频通道设置为喇叭(2) 的硬件连接图如下:喇叭接到开发板的 J6  PIN14 PIN15 引脚。

(3)功放引脚
    音频播放需要用到功放,下面是介绍如何查找功放引脚,以及如何查找对应的GPIO, 需要注意不同型号对应PIN脚可能不同,对应的GPIO也不同,以原理图和wiki为准进行查询,以下以EC600N 为例:
    ① 查看原理图,找到AUDIO部分的CTRL对应的引脚。

  在原理图找到 PIN40,然后移步到 wiki 上面查找对应的GPIO口即可。

注:

链接:class Pin -  控制 I/O 引脚  - QuecPython (quectel.com)

原理图获取:原理图可私信小Q 咨询官方技术支持获取

二、Audio 功能

(1)基础概念

Audio 音频播放是指使用音频编解码器将音频文件或音频流转换为模拟信号,通过输 出通道(如听筒、耳机、喇叭等)播放出来的过程。

•  音频播放需要创建一个 Audio 对象,指定输出通道,如aud = audio.Audio(0)表示使用听筒出。

•  音频播放可以使用 aud.play(priority, breakin, filename)方法,指定播放优先级、打断模式和 文件名称,支持 mp3 、amr 和 wav 格式的文件。

•  使用 aud.playStream(format, buf)方法,指定音频流格式和内容,支持 mp3 、amr 和 wav 格 式的音频流播放。

(2) 功能演示

  把 music.mp3 文件放到模组里 ,支持 mp3 、amr 和 wav 格式的文件。

② QPYcom 交互页面演示

③ 脚本演示

链接:class Audio -  音频播放  - QuecPython (quectel.com)

三、TTS 功能

(1)基础概念

    TTS  Text To Speech 的缩写, 即文本转语音,是一种能把文字内容转换为语音输出的技术。TTS技术的原理是,根据输入的文本内容,系统会针对每个文字或音节生成相应的语音单元,并结合音调、语速、语调以及发音规则等参数,最终生成语音输出。这样,用户就能够通过听取语音来获取文字信息。当前 TTS 模块主要包含如下接口:

•  初始化:使用 audio.TTS()创建一个TTS 对象,指定输出通道。

•  播放:使用 TTS 对象的 play()方法,可以将指定的文本转换为语音并播放,可以指定是否打断、优先级、语速、语调等参数。

•  停止:使用 TTS 对象的 stop()方法,可以停止当前正在播放的语音。

•  暂停:使用 TTS 对象的 pause()方法,可以暂停当前正在播放的语音。

•  恢复:使用 TTS 对象的 resume()方法,可以恢复暂停的语音。

•  设置:使用 TTS 对象的 set_volume() set_speed()等方法,可以设置音量、语速等参数。

(2) 功能演示

QPYcom交互界面演示

  脚本演示

链接:class TTS  -  文本到语音播放  -  QuecPython  (quectel.com)

附言:

     以上就是本次 QuecPython 的音频播放实验介绍,各位小伙伴赶紧来试试吧,如有任何疑问,欢迎各位和小Q进行探讨和交流。

GPT (Generative Pre-trained Transformer)是由OpenAI公司开发的一系列自然语言处理模型。它采用多层Transformer结构来预测下一个单词的概率分布,通过在大型文本语料库中学习到的语言模式来生成自然语言文本。GPT系列模型包括多个版本,如GPT-2和GPT-3等。\[2\]这些模型在不同任务中展现了出色的性能,包括零样本学习和少样本学习等。GPT使用Transformer的Decoder结构,并对其进行了一些改动,保留了Mask Multi-Head Attention。\[3\]通过这些改进,GPT模型在自然语言处理领域取得了显著的成果。 #### 引用[.reference_title] - *1* [深入理解深度学习——GPTGenerative Pre-Trained Transformer):基础知识](https://blog.csdn.net/hy592070616/article/details/131341012)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [【LLM系列之GPTGPTGenerative Pre-trained Transformer)生成式预训练模型](https://blog.csdn.net/yanqianglifei/article/details/130756814)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值