语音系统前端—利用SAPI进行声音识别与发声

最新推荐文章于 2022-03-29 12:44:19 发布

無菌與

最新推荐文章于 2022-03-29 12:44:19 发布

阅读量1.2k

点赞数

分类专栏：语音方面文章标签：语音识别 SAPI SR TTS

本文链接：https://blog.csdn.net/junk2012/article/details/40476261

版权

本文介绍了如何在Windows平台上利用微软的SAPI进行语音识别（SR）和文本转语音（TTS）操作。SAPI提供SR接口将语音转化为文字，以及TTS接口将文字读出。通过示例代码展示了其实现过程。

摘要由CSDN通过智能技术生成

在前一章，自然语言问答系统的构造中将整个分为7大模块。这里讲解语音识别与发声模块。

在现有的技术中，windows平台能比较快速上手的应该就是微软的SAPI了。

SAPI中提供的两个主要接口是：

1.SR（Speech Recognition），能直接将语音信号转化成文字；

2.TTS（Text-To-Speech），能直接将文字读出来。（当然，你需要有语音包）

部分测试代码如下：

//语音识别的初始化函数
//主要是创建识别器、上下文环境等
HRESULT InitializeSpeech()
{
	HRESULT hr=E_FAIL;
	if (SUCCEEDED(hr = ::CoInitialize(NULL)))
	{
		/****/
		//自己加一个recognizer，避免对系统自带语音的使用
		hr=cpReconizer.CoCreateInstance(CLSID_SpInprocRecognizer);
		if(FAILED(hr))
		{
			printf("Recognizer创建失败！");