c# 实现初级的语音识别

目前支持中文的Speech SDK最高版本为Windows平台下的SAPI 5.1(),本文介绍如何在.net平台下利用SAPI5.1开发中文语音应用程序。 
1. SAPI.51 SDK浅析以及安装 
SAPI SDK是微软公司免费提供的语音应用开发工具包,这个SDK中包含了语音应用设计接口(SAPI)、微软的连续语音识别引擎(MCSR)以及微软的语音合成(TTS)引擎等等。目前的5.1版本一共可以支持3种语言的识别 (英语,汉语和日语)以及2种语言的合成(英语和汉语)。SAPI中还包括对于低层控制和高度适应性的直接语音管理、训练向导、事件、语法编译、资源、语音识别(SR)管理以及TTS管理等强大的设计接口。其结构如图(1): 
图(1) 
语音引擎则通过DDI层(设备驱动接口)和SAPI(SpeechAPI)进行交互,应用程序通过API层和SAPI通信。通过使用这些API,用户可以快速开发在语音识别或语音合成方面应用程序。 
SAPI5.1 SDK可以从微软网站下载:http://www.microsoft.com/speech/download/sdk51/ 需要安装程序的有Speech SDK 5.1(68M)和5.1 Language Pack (81.5M)。 
3. 用C#开发中文TTS应用程序示例 
下面通过一个实例来介绍如何利用C# 进行开发语音应用程序,开发环境为: 
操作系统: Windows 2000 中文版+ SP3 
.Net Framework: 1.0.3705(英文版) 
Visual Studio.Net 7.0.9466(英文版) 
首先,新建一个C#的Windows Application工程SpeechApp,在开发环境的右边的解决方案管理器(Solution Explorer)中,添加DotNetSpeech对象库。右键点击"Reference"(参考),选择"Add Reference"(添加参考),在弹出的文件选择对话框中找到D:\Program Files\Common Files\Microsoft Shared\Speech\目录下面找到SAPI.dll,
以下为引用的内容: 
//朗读 
private void buttonSynthesis_Click(object sender, System.EventArgs e) 

try 

SpeechVoiceSpeakFlags SpFlags = SpeechVoiceSpeakFlags.SVSFlagsAsync; 
SpVoice Voice = new SpVoice(); 
Voice.Speak(this.textBoxText.Text, SpFlags); 

catch(Exception er) 

MessageBox.Show("An Error Occured!","SpeechApp", MessageBoxButtons.OK, MessageBoxIcon.Error); 


//生成声音文件(Wav) 
private void buttonTTStoWave_Click(object sender, System.EventArgs e) 

try 

SpeechVoiceSpeakFlags SpFlags = SpeechVoiceSpeakFlags.SVSFlagsAsync; 
SpVoice Voice = new SpVoice(); 
SaveFileDialog sfd = new SaveFileDialog(); 
sfd.Filter = "All files (*.*)|*.*|wav files (*.wav)|*.wav"; 
sfd.Title = "Save to a wave file"; 
sfd.FilterIndex = 2; 
sfd.RestoreDirectory = true; 
if (sfd.ShowDialog()== DialogResult.OK) 

SpeechStreamFileMode SpFileMode = SpeechStreamFileMode.SSFMCreateForWrite; 
SpFileStream SpFileStream = new SpFileStream(); 
SpFileStream.Open(sfd.FileName, SpFileMode, false); 
Voice.AudioOutputStream = SpFileStream; 
Voice.Speak(txtSpeakText.Text, SpFlags); 
Voice.WaitUntilDone(Timeout.Infinite); 
SpFileStream.Close(); 


catch(Exception er) 

MessageBox.Show("An Error Occured!","SpeechApp", MessageBoxButtons.OK, MessageBoxIcon.Error); 


 

接下来,还要去控制面板配置Speech SDK引擎当前所处理语言。打开"控制面板",打开"语音"配置项目,可以看到在这里我们可以指定当前可以对何种语言进行识别或者合成,还可以配置相关的硬件设备以及控制语速。(如图4)

在"文字-语音转换"的"语音选择"组合框中选择简体中文(Microsoft Simplified Chinese)。这样就可以合成汉语文字了。 
回到VS.Net,F5编译运行刚才的应用程序,在文本框里输入汉字,戴上耳机,点击"朗读"按钮,开始体验新一代的智能人机界面吧,呵呵:)


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/12639172/viewspace-608077/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/12639172/viewspace-608077/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。
以下是一个简单的 C# 离线语音识别实现实时说话实时显示的例子: ```csharp using System; using System.Speech.Recognition; class Program { static void Main(string[] args) { // 创建语音识别引擎 SpeechRecognitionEngine recognizer = new SpeechRecognitionEngine(new System.Globalization.CultureInfo("en-US")); // 设置识别模式为离线模式 recognizer.SetInputToDefaultAudioDevice(); // 加载语音识别语法 var grammar = new Grammar("MyGrammar.xml"); recognizer.LoadGrammar(grammar); // 注册语音识别事件处理程序 recognizer.SpeechRecognized += new EventHandler<SpeechRecognizedEventArgs>(recognizer_SpeechRecognized); // 开始语音识别 recognizer.RecognizeAsync(RecognizeMode.Multiple); Console.WriteLine("Say something..."); while (true) { Console.Write("> "); string text = Console.ReadLine(); // 实时显示识别结果 Console.WriteLine("Recognized text: " + recognizer.RecognizeAsyncCancel().Text); if (text.ToLower() == "exit") { break; } } recognizer.Dispose(); } static void recognizer_SpeechRecognized(object sender, SpeechRecognizedEventArgs e) { Console.WriteLine("Recognized text: " + e.Result.Text); } } ``` 上述代码中,我们使用了一个无限循环来等待用户输入文字,同时调用 `recognizer.RecognizeAsyncCancel().Text` 实时获取语音识别结果并显示在控制台上。当用户输入 "exit" 时,退出程序并释放语音识别引擎。注意,由于 `recognizer.RecognizeAsyncCancel()` 方法会取消当前正在进行的语音识别操作,因此在实际应用中需要根据具体需求进行适当调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值