![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
音频开发
文章平均质量分 78
qianjintianguo
这个作者很懒,什么都没留下…
展开
-
语音编程之Speech SDK概述(3)
5.管理COM对象的生命期当对象被创建时,系统将分配必需的内存资源。当一个对象不再需要时,应该删除它。系统将收回它所占有的内存,以用于其他目的。对于C++对象,应直接使用new 和delete 操作符来控制对象的生命期。COM不允许直接创建或删除对象。其原因是同一对象可能被多个应用程序所使用。如果其中的一个应用程序要删除该对象,其他的应用程序就可能失败。实际上,COM采用引用计数系统来控制对象转载 2006-04-20 17:40:00 · 3721 阅读 · 0 评论 -
WIN32音频数据采集---WaveIn-Out实现
WIN32音频数据采集---WaveIn-Out实现 选择自 dansin 的 Blog 关键字 WIN32音频数据采集---WaveIn-Out实现 出处 基本步骤及思想:设定音频采集参数(采样率、声道等),打开音频设备和开辟缓存,操作采集的数据。1. 定义音频采集参数 WAVEFORMATEX waveform;//WAVE波形的采集参数typ转载 2006-05-07 10:22:00 · 1693 阅读 · 0 评论 -
FFT of waveIn audio signals
FFT of waveIn audio signalsBy Aqiruse An article on using the Fast Fourier Transform on audio signals. IntroductionThe Fast Fourier Transform (FFT) allows users to view the spectrum content of转载 2006-05-08 10:20:00 · 2842 阅读 · 0 评论 -
语音编程之Speech SDK概述(2)
如果需要关于方法运行结果的更详细的信息,必须测试每一个相关的HRESULT值。但经常只关心方法是成功的还是失败的。一种可靠的测试HRESULT类型值说明成功还是失败的方法是利用如下的宏来判断,这些宏定义在Winerror.h中。1)宏SUCCEEDED返回TRUE作为成功码,返回FALSE作为失败码;2)宏FAILED返回TRUE作为失败码,返回FALSE作为成功码;可以使用宏FAIL转载 2006-04-20 17:39:00 · 3144 阅读 · 1 评论 -
MP3 技 術 縱 覽 ( 中 文 修 訂 版 1.3 )
MP3 技 術 縱 覽 ( 中 文 修 訂 版 1.3 )MP3 就 是 *MPEG 第 1 號 標 準 第 三 資 訊 層 ( MPEG 1 - Layer 3 ) 的 簡 稱 。 MP3 是 一 個 聲 音 壓 縮 的 新 格 式 ﹐ 這 種 格 式 是 最 新 的 研 究 成 果 ﹐ 目 的 是 以 最 少 的 資 料 去 保 存 最 傳 真 的 聲 音 。 近 年 來 MP3 大转载 2006-04-20 10:47:00 · 967 阅读 · 0 评论 -
语音识别编程技术
语音识别编程涉及IspRecognizer,IspRecoContext和ISpRecoGrammar等多个语音识别引擎接口。下面先来设计一个操作语音识别的类CSpeechRecognition,然后基于该类来实现一个实例。11.3.1 构造CSpeechRecognition类CSpeechRecognition类封装了语音识别操作所需调用的几个接口,使用它进行语音识别编程很方便,也很转载 2006-04-20 18:15:00 · 4424 阅读 · 8 评论 -
语音编程之Text-To-Speech编程技术(1)
至此已做好了编写语音程序的准备工作,可以开始编写语音程序了。下面首先介绍文本-语音转换的编程技术。11.2.1 构造CText2Speech类为了便于使用Speech SDK提供的文本-语音转换COM接口,笔者编写了一个类CText2Speech,其中封装了文本-语音转换COM接口的基本方法。借助该类来编写文本-语音转换程序非常方便。先来讨论该CText2Speech类的设计,其定义转载 2006-04-20 17:43:00 · 2722 阅读 · 0 评论 -
语音编程之Speech SDK概述(4)
2.语音识别API正如IspVoice是主要的语音合成接口一样,IspRecoContext是语音识别的主要接口。与IspVoice一样,它也是一种ISpEventSource接口,提供了为请求的语音识别事件接收通知消息的基本载体。有两种不同的语音识别引擎(ISpRecognizer),即共享语音识别引擎(shared speech recognition engine)和进程内语音识别引转载 2006-04-20 17:41:00 · 4692 阅读 · 0 评论 -
语音编程之Speech SDK概述(1)
Microsoft Speech SDK提供关于语音(Speech)处理的一套应用程序编程接口SAPI(Speech Application Programming Interface)。SAPI提供了实现文字-语音转换(Text-to-Speech)和语音识别(Speech Recognition)程序的基本函数,大大简化了语音编程的难度,降低了语音编程的工作量。Speech SDK可以免费从如转载 2006-04-20 17:37:00 · 3238 阅读 · 0 评论 -
语音编程之Text-To-Speech编程技术(4)
如果不想处理有关语言的细节问题,只想显示和选择系统可提供的语音引擎,则可以直接调用Speech SDK提供的两个帮助函数SpInitTokenComboBox和SpInitTokenListBox来实现语音语言的显示和选择,其代码如下:HRESULT SpInitTokenComboBox( HWND hwnd, const WCHAR* p转载 2006-04-20 18:13:00 · 2815 阅读 · 0 评论 -
语音编程之Text-To-Speech编程技术(3)
语言函数的实现比较复杂。由于IspVoice接口提供的语言函数,都只与抽象的语音语言接口ISpObjectToken相关,而我们能看到的却是语音语言的描述,比如,通过控制面板的语音程序所能见到的就是语音语言的描述。因此,笔者设计了直接对语音语言进行操作的语言函数,包括获取系统中已安装的语音语言数目,设置指定的语音语言,获取指定的语音语言描述(包括当前设定的语音语言)。它们的代码如下:ULONG转载 2006-04-20 18:09:00 · 2291 阅读 · 0 评论 -
语音编程之Text-To-Speech编程技术(2)
用于使我们的代码能操作Speech SDK中的相关的接口、函数和常量。Speech SDK支持事件。为了与窗口交互,这里在类中定义了消息WM_TTSEVENT。当发生Speech事件时,向相应的窗口发送WM_TTSEVENT消息。在窗口中响应该消息就响应了相应的事件。CText2Speech类中定义了一个操作Text-To-Speech引擎的接口指针m_IpVoice,作为数据成员,其定义转载 2006-04-20 18:08:00 · 2920 阅读 · 1 评论 -
杜比AC-3与DTS的音效对比 浅解
AC3与DTS环绕音效浅解每当我欣赏DVD的时候,那震撼的5.1声道音响所营造的真实现场感,总是让我们心潮澎湃,难以平静,这是CD碟音效所不能比拟的。Dolby Surround与Dolby Pro Logic是目前所有AV扩大机上面最常见到的环绕音效模式。Dolby Digital(AC-3)Dolby Digital就是大家常听见的Dolby AC-3环绕音效,在杜比数码(Do转载 2011-12-16 08:10:23 · 6078 阅读 · 0 评论