在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。
在消费者产品领域,AI学习机、翻译笔等AI+学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI+办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI+生活产品,让更多人享受AI科技的便利。
语音的发展路径:
针对智能语音多学科交叉的学科特性,研究人员需要探索新原理、新机制、新材料、新工艺和新器件,集成创新推动核心技术进步。另一方面,语音技术需要进一步向深度理解延伸。“更先进的语音交互系统不仅要 “能听会说” ,还要深度地去理解人的信息。有了明确的发展方向,才能促进智能语音技术持续突破。
二、Python 语音识别
(1)、文本转换为语音
(a)、使用 pyttsx
安装 pyttsx 包
- import pyttsx3 as pyttsx
import pyttsx3 as pyttsx
engine = pyttsx.init()
engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')
engine.runAndWait()
如果你安装没有出错,打开电脑的声音,就能听到语音(把我们刚才在代码里写的文本文字转换成语音播报出来了)
代码分析:
pyttsx3通过初始化来获取语音引擎,在调用init后会返回一个engine对象。
import pyttsx3
#初始化语音引擎
engine = pyttsx3.init()
设置语速、音量等参数:
engine.setProperty(‘rate’, 100) #设置语速
engine.setProperty(‘volume’,0.6) #设置音量
查看语速、音量等参数
rate = engine.getProperty(‘rate’)
print(f’语速:{rate}‘)
volume = engine.getProperty(‘volume’)
print (f’音量:{volume}’)
完整实例代码:
import pyttsx3 as pyttsx
engine = pyttsx.init()
engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')
rate = engine.getProperty('rate')
print(f'语速:{rate}')
volume = engine.getProperty('volume')
print (f'音量:{volume}')
engine.runAndWait()
运行结果为:
查看语音合成器
voices = engine.getProperty(‘voices’)
for voice in voices:
print(voice)
合成器的主要参数如下:
合成器的主要参数如下: |
age |
gender |
id |
languages |
name |
语音合成器 |
#设置第一个语音合成器
voices = engine.getProperty(‘voices’)
engine.setProperty(‘voice’,voices[0].id)
语音播报:
engine.say(‘I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。’)
engine.runAndWait()
engine.stop()
import pyttsx3
engine = pyttsx3.init() #初始化语音引擎
engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')
rate = engin