语音识别

最新推荐文章于 2022-11-28 22:16:20 发布

netjuly

最新推荐文章于 2022-11-28 22:16:20 发布

阅读量990

点赞数

分类专栏： Speech 文章标签： microsoft pascal 微软 google 数据库 mfc

Speech 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

来自(http://blog.csdn.net/txdb/article/details/7061100)

siri的出现让语音识别一下子很热门啊。下午有空，找几篇语音识别的论文看看。发现语音识别的研究圈子好像比计算机视觉封闭。

像opencv这样的开源库，以及mnist， pascal voc等很容易找到的研究库，语音识别也一时google不出来。

语音识别的英文翻译：speech recognition

另一方面，IBM的viavoice ，微软的语音识别sdk 倒是很容易下载到，似乎是说语音识别是一个商业化程度比较高的研究领域。

比较简单的文章。

1.小词汇量语音识别系统的实现这个来自pudn网。一个简单的语音识别系统，分端点检测，特征提取和量化，然后由HMM识别。

2.基于MFC 平台下的语音识别系统的设计百度文档下的。这个文章演示了用ms speech sdk 5.1 创建一个语音识别程序的大致过程。google了下，这个sdk 似乎是2009年以前的

微软现在搞了个tellme。http://www.microsoft.com/en-us/Tellme/developers/default.aspx 这里有个Microsoft Speech Platform 以及更新到10.2了。应该比speech sdk 5.1 先进。

还有一个选择是https://studio.tellme.com/ tellme studio 提供云端服务。用起来，可能很方便。

网站有tellme 和siri的对比试验，看了下siri确实很好用。tellme没有对程序控制做深入的控制，识别率也不差。

曾经用过win7的 tellme 实在是不咋地。

3.汉语大词汇量连续语音识别系统研究进展汉语的，来自中科院自动化研究所。对语音识别的历史和现状介绍的比较相信。这里提到了NIST ，

http://nist.gov/itl/iad/mig/ 可以申请得到一个测试数据库。。不过要传真申请。一般人估计也不会给。

这里的几个项目都很有趣，比如基于视频检测的超市防偷盗系统。说话人识别，基于多摄像头的特定人跟踪（有数据库可以下载）等等。

这样看下来，还是先了解下微软的tellme studio。今年9月份，微软还有一篇整句识别能力大幅度提高的论文。可能到明年，tellme 真会有大进展。

可是tellme studio 已经关闭了free access

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
语音识别

来自(http://blog.csdn.net/txdb/article/details/7061100) siri的出现让语音识别一下子很热门啊。下午有空，找几篇语音识别的论文看看。发现语音识别的研究圈子好像比计算机视觉封闭。像opencv这样的开源库，以及mnist， pascal voc等很容易找到的研究库，语音识别也一时google不出来。语音识别的英
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。