实现文本合成语音(TTS)并生成wav音频文件—SAPI 5.4

      本部分代码使用微软Microsoft Speech API (SAPI) 5.4 和VS2013实现输入文本文件并合成语音进行播放,同时也可以将合成的语音文件生成.wav格式的音频文件,下面是程序的源代码:

 
#include <sapi.h>
#include <sphelper.h>

bool isCreatWavFile = false;//是否创建.wav音频文件
int main()
{
	ISpVoice *pVoice = NULL;
	if (FAILED(::CoInitialize(NULL)))
		return FALSE;
	HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice, (void **)&pVoice);
	if (SUCCEEDED(hr))
	{
		//如果生成音频文件,在WTX[]中输入音频文本内容
		if (isCreatWavFile)
		{
			CComPtr <ISpStream> cpWavStream;
			CComPtr <ISpStreamFormat> cpOldStream;
			CSpStreamFormat originalFmt;
			pVoice->GetOutputStream(&cpOldStream);
			originalFmt.AssignFormat(cpOldStream);
			hr = SPBindToFile(L"d:\\output.wav", SPFM_CREATE_ALWAYS, &cpWavStream, &originalFmt.FormatId(), originalFmt.WaveFormatExPtr());
			if (SUCCEEDED(hr))
			{
				pVoice->SetOutput(cpWavStream, TRUE);
				WCHAR WTX[] = L"凡事何必都看淡,自己理解就很好,决定我们一生的,是我们的选择。我们时刻都在失去,我们努力的想去拥有更多的精彩,可惜只有两只手,所以必须学会选择,学会放弃。要清楚哪些是我们不需要的,如果心的欲望太大,什么都想抓,可能最后什么知足心灵。只平淡命运无奈";
				pVoice->Speak(WTX, SPF_IS_XML, NULL);
				pVoice->Release();
				pVoice = NULL;
			}
		}
		else
		{
			hr = pVoice->Speak(L"Hello world", 0, NULL);
			pVoice->Release();
			pVoice = NULL;
		}
		
		
	}

	::CoUninitialize();
	return TRUE;
}


提示:如果运行过程中出现error C4996:'GetVersionExW':被声明为已否决的错误,请请右键-项目-属性-C/C++-常规-SDL检查-否(/sdl)就可解决。
  • 11
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
在 Windows 平台上,可以使用 Microsoft 提供的 Text-to-Speech (TTS) API 来将文本转换语音文件。以下是一个使用 C++ 编写的示例程序,可以将输入的文本转换WAV 格式的语音文件: ```cpp #include <windows.h> #include <sapi.h> #include <sphelper.h> int main() { // 初始化 COM 组件 CoInitialize(NULL); // 创建 TTS 引擎 ISpVoice* pVoice = NULL; HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice, (void**)&pVoice); if (FAILED(hr)) { CoUninitialize(); return 1; } // 设置输出音频格式为 WAV hr = pVoice->SetOutput(NULL, TRUE); if (FAILED(hr)) { pVoice->Release(); CoUninitialize(); return 1; } // 输入需要转换语音文本 const wchar_t* text = L"Hello, world!"; // 将文本转换语音并输出到文件 WCHAR fileName[MAX_PATH] = L"output.wav"; hr = pVoice->Speak(text, SPF_DEFAULT, NULL); if (SUCCEEDED(hr)) { ISpStream* pStream = NULL; hr = SPBindToFile(fileName, SPFM_CREATE_ALWAYS, &pStream, NULL, SPFEI_WAVEFORMAT); if (SUCCEEDED(hr)) { hr = pVoice->SetOutput(pStream, TRUE); if (SUCCEEDED(hr)) { hr = pVoice->Speak(text, SPF_DEFAULT, NULL); } pStream->Release(); } } // 释放 TTS 引擎 pVoice->Release(); // 释放 COM 组件 CoUninitialize(); return 0; } ``` 在上述示例程序中,首先需要使用 CoCreateInstance 函数创建 TTS 引擎的实例,然后使用 SetOutput 函数设置输出音频格式为 WAV。接着,将需要转换语音文本作为参数传递给 Speak 函数即可将其转换语音。最后,使用 SPBindToFile 函数将语音输出到文件中即可。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值