jetson nano人工智能开发板 --在nano上实现文字转语言,语音交互
**硬件需求:jetson nano上需要有usb声卡或者支持声卡外放的音频设备。
首先介绍下python中的文字转语音库**
一、pyttsx3 库简介、安装、以及简单使用
1、pyttsx简介
PyTSX、gTTs是一个支持Mac OS X、Windows和Linux上常见的文本到语音引擎的Python包。
2、pyttsx安装
pip3 install pyttsx
pip3 install pyttsx3
3、pyttsx使用方法
import os
import pyttsx3
engine=pyttsx3.init()
engine.setProperty('rate',150)
engine.setProperty('voice','english+f2')
text='Get ready to listening my voice!'
engine.say(text)
engine.runAndWait
二、gTTs库简介、安装、以及简单使用
1、gTTs安装
sudo pip3 install gTTs
2、gTTs使用方法
import os
from gtts import gTTS
myText='Get ready to listening my voice!'
myOutput=gTTS(text=myText,lang='en',slow=False)
myOutput.save('talk.mp3')
os.system('mpg123 talk.mp3')
三、mpg123简介、安装以及简单使用
1、mpg123简介
mpg123是基于命令行的音频播放及界面器
同时mpg123是一个音频解码工具,负责解码,然后调用驱动播放音乐或者视频。(默认调用的驱动是dps/alsa)
官网:
链接: http://www.mpg123.de/.
2、linux下安装
sudo apt-get install mpg123
3、使用
常用命令行介绍
-s, --stdout
将解码的音频采样写到标准输出,而不是通过音频设备。如果你的音频设备不支持mpg123的话,就必须使用这个选项。
-w file, --wav
将输出写到WAV格式的文件中。
-m, --mono, --mix, --signlemix
混合两个通道/解码单声道。与完全立体声解码相比,它占用的CPU时间更少
-C, --control
启用终端控制键。默认情况下,使用“ s”或空格键停止/重新开始(暂停,取消暂停)播放,“ f”向前跳到 下一首歌“ b”跳回到首歌“”,倒带“。”。快进,“ q”退出。输入“ h”表示完整 可用控件列表。
-q, --quiet
Quiet. Suppress diagnostic messages.
使用示例:
mpg123 monster.mp3 monster.wav
将mp3格式的文件转化为wav格式
mpg123 monster.mp3 播放音乐
参考链接
http://blog.csdn.net/changfengxiongfei/article/details/5451027