语音识别
如梦如幻2015
学生
展开
-
iFly Mobile Speech Platform Mobile Speech Client 5.0(移动语音讯飞平台开发手册)
// iatdemo.cpp : Defines the entry point for the console application.//#include "stdafx.h"#include #include #include "windows.h"#include "../include/qisr.h"#include #pr原创 2016-03-01 14:36:27 · 1510 阅读 · 0 评论 -
VC++基于微软语音引擎开发语音识别总结
关于SAPI的简介API 概述SAPI API在一个应用程序和语音引擎之间提供一个高级别的接口。SAPI 实现了所有必需的对各种语音引擎的实时的控制和管理等低级别的细节。SAPI引擎的两个基本类型是文本语音转换系统(TTS)和语音识别系统。TTS系统使用合成语音合成文本字符串和文件到声音音频流。语音识别技术转换人类的声音语音流到可读的文本字符串或者文件。转载 2016-02-29 10:42:52 · 851 阅读 · 0 评论 -
采用PCM对信号进行编码,若采样频率为8000次/秒,量化级为256级,那么数据传输率要达到多少?
采样频率fs=8000Hz,量化为256级,N=log2(256)=8bit,即一个数据可以用8bit来表示,可以容易得到数据传输速率为: P=fs*N=8000*8=64kbps原创 2016-04-06 21:00:31 · 21656 阅读 · 1 评论 -
中文分词之HMM模型详解
关于HMM模型的介绍,网上的资料已经烂大街,但是大部分都是在背书背公式,本文在此针对HMM模型在中文分词中的应用,讲讲实现原理。尽可能的撇开公式,撇开推导。结合实际开源代码作为例子,争取做到雅俗共赏,童叟无欺。没有公式,就没有伤害。模型介绍第一次听说HMM模型是从李开复的博文论文中听说的:李开复1988年的博士论文发表了第一个基于隐马尔科夫模型(HMM)的语音识别系统S转载 2016-04-06 22:24:15 · 925 阅读 · 1 评论 -
HMM学习笔记_2(从一个实例中学习HMM前向算法)
HMM算法想必大家已经听说了好多次了,完全看公式一头雾水。但是HMM的基本理论其实很简单。因为HMM是马尔科夫链中的一种,只是它的状态不能直接被观察到,但是可以通过观察向量间接的反映出来,即每一个观察向量由一个具有相应概率密度分布的状态序列产生,又由于每一个状态也是随机分布的,所以HMM是一个双重随机过程。 HMM是语音识别,人体行为识别,文字识别等领域应用非常广泛。转载 2016-04-07 08:53:30 · 380 阅读 · 0 评论 -
浅读讯飞语音云
讯飞语音云,是科大讯飞基于云计算技术基础,将业界领先的智能语音核心技术向广大移动互联网开发者开放的全球首个同时提供语音合成、语音搜索、语音听写等智能语音交互能力的智能语音交互平台。什么是云计算呢?云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中原创 2016-03-01 08:37:09 · 1144 阅读 · 0 评论 -
语音识别工具箱之HTK安装与使用
HTK(HMM Toolkit)一款基于hmm模型的语音处理工具,早就听说它了,一直因为用MATLAB中的工具箱在学习,或自己写代码在做HMM方面的试验,所以没有接触到它。现在,上海朋友家里的网速超赞,我就趁投简历的时间空隙,下载了它的一些资料,包括安装文件,使用文档(最好中英文版都要找到,有时中文版更简洁,更节省时间,英文版则较详细,当发现自己调试不通过时,就有参考了),并做了基本的识别实验。下转载 2016-03-25 16:32:20 · 1280 阅读 · 0 评论 -
应用HTK搭建语音拨号系统--创建单音素HMM模型
应用HTK搭建语音拨号系统--创建单音素HMM模型哈尔滨工业大学人工智能研究室2006年10月30日 该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。转载 2016-03-26 09:36:46 · 1483 阅读 · 0 评论 -
基于HTK的语音拨号系统
基于 HTK 的语音拨号系统Veket NWPU2011-6-22目标:该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词( sub-word,eg.. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。内容:1. 数据准备(1) 任务语法定义(转载 2016-03-26 09:59:40 · 571 阅读 · 0 评论 -
用HTK搭建语音识别器实录(TIDigits数据库)
TIDIGITS数据库包含11个孤立数字,分别为one,two,three,four ,five,six,seven,eight,nine,oh,zero.1.数据准备1.1.1 建立任务语法它的任务语法如下:$digit= ( one | two | three | four | five |six | seven | eight | nine | zero |转载 2016-03-26 10:01:18 · 740 阅读 · 2 评论 -
研究生期间有关语音识别方面资料的收集
研究生期间收集了一些有关语音识别方面的网址,感觉非常有用,保留一下,留到以后用。国际最顶尖会议:ICASSP:International Conference on Acoustics, Speech and Signal Processing ICSLP:International Conference on Semiconductor Laser and Photonics转载 2016-02-28 21:25:08 · 964 阅读 · 1 评论 -
用HTK搭建语音识别器实录(TIDigits数据库)
TIDIGITS数据库包含11个孤立数字,分别为one,two,three,four ,five,six,seven,eight,nine,oh,zero.1.数据准备1.1.1 建立任务语法它的任务语法如下:$digit= ( one | two | three | four | five |six | seven | eight | nine | zero |转载 2016-02-28 21:22:00 · 1321 阅读 · 0 评论 -
语音识别资料
[1]语音识别-维基百科:http://zh.wikipedia.org/wiki/语音识别[2]语音合成-百度百科:http://baike.baidu.com/view/549184.htm[3] Microsoft Speech API:http://en.wikipedia.org/wiki/Speech_Application_Programming_Interface#转载 2016-02-28 20:59:32 · 522 阅读 · 0 评论 -
语音识别的介绍
语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。。中国物联网校企联盟形象得把语音识别[1] 比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。 语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人原创 2016-03-02 09:08:50 · 4195 阅读 · 2 评论 -
关于讯飞语音听写使用过程中出现的问题
音听写(语音转文字)的功能实现,决定采用讯飞语音实现,但过程中出现的问题确实令人摸不着头脑(话说我之前都没遇到过哎),还好后来都被我解决掉了。特此记录,以备查看。 1.第一个问题是int ret = mIat.startListening(recognizerListener);调用完成后得到的ret不是正常的0(SUCCESS),而是21001。 于是各种谷歌百度,各种说法,也许各种原创 2016-03-02 10:19:58 · 1976 阅读 · 0 评论 -
讯飞在线命令识别 动态库 交叉编译后找不到的问题
环境配置: 树莓派B+ , ubuntu 14.04, ROS, wiringPi, vs1003B, 讯飞在线语音识别库 系统功能: 通过vs1003的麦克风采集声音,然后将声音转码为讯飞要求的pcm格式,然后在树莓派中调用讯飞提供的在线命令识别API,完成语音识别功能.碰到的问题:转载 2016-03-04 08:47:19 · 1284 阅读 · 0 评论 -
基于科大讯飞语音云windows平台开发
前记:前段时间公司没事干,突发奇想想做一个语音识别系统,看起来应该很简单的,但做起来却是各种问题,这个对电气毕业的我,却是挺为难的。谷姐已经离我们而去,感谢度娘,感谢CSDN各位大神,好歹也做的是那么回事了,虽然还是不好用,但基本功能实现了。该软件使用VS2008C++/CLR开发,由于科大讯飞提供的是C的API接口,结果到这边就是各种不兼容,CLR是基于托管堆运行的,而这个API转载 2016-03-04 08:49:20 · 1901 阅读 · 0 评论 -
关于讯飞语音SDK开发学习
前奏,浑浑噩噩已经工作一年多,这一年多收获还是挺多的。逛园子应该有两年多了,工作后基本上是天天都会来园子逛逛,园子 里还是有很多牛人写了一些不错的博客,帮我解决很多问题。但是一直没写过博客,归根到底一个字“懒”,还有就是不知道该写 些什么...今天把我最近研究讯飞语音东东,分享一下,不过有些还是前辈们提供的。之前公司让我做一个小的语音识别功能,一开始我就建议使用讯飞语音,个人觉得讯飞识别正转载 2016-03-04 08:53:02 · 10681 阅读 · 9 评论 -
Kinect for Windows SDK开发入门(十二):语音识别 上
1. 麦克风阵列 安装完Microsoft Kinect SDK之后,语音识别的组件会自动安装。Kinect的麦克风阵列工作在一些语音识别的类库之上,这些类库是从Vista系统之时就有的。他们包括语音捕获DirectX多媒体对象(DirectX Media Object,DMO)以及语音识别API(Speech Recognition API,SAPI)。 在转载 2016-03-09 19:45:35 · 1184 阅读 · 0 评论 -
[译]Kinect for Windows SDK开发入门(十三):语音识别 下
上一篇文章介绍了Kinect中语音识别的基本概念,以及一些语音处理方面的术语。在此基础上使用Kinect麦克风阵列来进行音频录制的例子说明了Kinect中音频处理的核心对象及其配置。本文将继续介绍Kinect中的语音识别,并以两个小例子来展示语音识别中的方向识别和语音命令识别。 1. 使用定向麦克风进行波速追踪(Beam Tracking for a Directional Mic转载 2016-03-09 19:47:10 · 549 阅读 · 0 评论 -
Kinect for Windows SDK开发入门(一):开发环境配置
前几天无意中看到微软发布了Kinect for windows sensor,进去看了一下Kinect应用的例子,发现Kinect除了作为xbox360游戏的外设外还能开发一些很酷的应用,而且微软也发布可针对Kinect开发的Kinect for windows SDK1.0正式版本,原本想买一个Kinect for windows sensor来进行开发玩一玩的,可是那个出来没多久,淘宝上只有代转载 2016-03-09 20:32:42 · 586 阅读 · 0 评论 -
VC++基于微软语音引擎开发语音识别总结
关于SAPI的简介API 概述SAPI API在一个应用程序和语音引擎之间提供一个高级别的接口。SAPI 实现了所有必需的对各种语音引擎的实时的控制和管理等低级别的细节。SAPI引擎的两个基本类型是文本语音转换系统(TTS)和语音识别系统。TTS系统使用合成语音合成文本字符串和文件到声音音频流。语音识别技术转换人类的声音语音流到可读的文本字符串或者文件。 文本语音转换转载 2016-02-28 20:57:07 · 915 阅读 · 1 评论 -
crossvalind Matlab 交叉验证
这个适用于Cross validation。中文应该叫做交叉验证。P_train=[1 2 3 4 5 6 7 8 ]'P_train = 1 2 3 4 5 6 7 8Indices=crossvalind('Kfold',8,4)Indices =转载 2016-04-08 15:01:26 · 761 阅读 · 0 评论