自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

u010384318的专栏

机器学习 语音识别 ing

  • 博客(13)
  • 资源 (4)
  • 收藏
  • 关注

原创 跨年巨献-----timit数据库下载(不再提供下载)

上次在博文语音识别系统之htk-----连续语音识别中提到,一旦确认自己下载的timit是完整的,就会给大家的。前几天,有人在群里问timit数据库的事情,后来无意找到在linux下用命令下载,终于把http://www.fon.hum.uva.nl/david/ma_ssp/2007/TIMIT/下载完整。现在上传给大家,本来打算放csdn下载里,但比较麻烦。现在直接放我百度网盘里。希望对你

2013-12-31 20:41:44 12979 22

转载 几个常见的语音交互平台的简介和比较

由于自己上次可能没写好,这次突然见到这个,就转载到这里。转载:http://ibillxia.github.io/blog/2012/11/24/several-plantforms-on-audio-and-speech-signal-processing/几个常见的语音交互平台的简介和比较1.概述最近做了两个与语音识别相关的项目,两个项目的主要任务虽然都是语音识别,或者更确

2013-12-31 00:02:37 3502

原创 语音识别工具箱综述和产品介绍

今天是周末,想来想去,还是写一篇这样的博文吧。算是对语音识别这一段时间的总结,为后来的人融入铺好前面的路。这个只是工具箱的综述,不是语音识别的综述。希望您有所收获。    目前,语音识别领域公开的开源的代码或者说工具箱有:sphinx,htk,julius,kaldi。也许也有其他的吧。下面我尽量一一介绍:1.sphinx:这个是李开复的博士论文。后面不断的壮大,有了后来的版本。这个比较小

2013-12-29 16:42:12 3352 2

原创 语音识别系统之htk-----连续语音识别

在零落_World的合作下,终于完成了htk实现连续语音识别的一个流程。中间遇到了很多不大不小的问题。具体的可以见:            1.

2013-12-29 15:00:59 11129 8

转载 TIMIT语音库-----下载和matlab读取

TIMIT语音库为大多数论文及研究中常用的语音库,适用于语音识别、说话人识别等语音信号处理。在MIT网站可以找到一些样例, 为 16kHz sampling, 16 bit sample, PCM encoding。样例才160个句子,不够用。这儿能找到完整版,用抓取工具全部下载下来有600多M但问题是虽然其为wav结尾,matlab中wavread却读不了,用二进制打开文件发现

2013-12-25 11:37:07 10442 8

原创 语音识别系统之htk------孤立词识别(yesno)

孤立词的识别应该是最基础了,搭完htk的环境和安装好,首先就应该实验下。网上这方面的介绍也很多,大家可以去参考参考。下面就是整个过程:一 数据准备   说明:由于自己的linux操作系统不支持麦克风输入。所以在windows下准备数据。下午折腾了下,感觉比较麻烦。网上说需要安装oss,但是我的ubuntu版本似乎没找到对应的版本,我还是放弃了。这个是后话了。如果大家有什么更好的办法,可以告

2013-12-24 20:27:23 6033 1

原创 语音识别系统之htk----安装

这篇博客本来应该在很早之前就写出来,但一直被耽搁了。今天把上一个项目的事情结束了,从明天开始,我就开始我的开题---基于歌声的音乐分离。通俗的说就是去掉我们听的音乐里的人声,把伴奏留下。但愿我可以把这个事情做的很好吧。算给自己个好好的交代,但是我不会忘记语音识别这个事情。毕竟我研一花了那么多的时间,实验室不支持也没事,坚持做自己喜欢,牺牲下自己的课余时间就可以了。好了,言归正转。明天圣诞节了,大家

2013-12-24 19:12:00 1930 1

原创 语音识别系统之kaldi------voxforge实例

首先来介绍下voxforge。voxforge是个收集语音的网址,你可以免费的得到

2013-12-24 18:59:41 12164

原创 语音识别系统kaldi----实例说明

最近一直在折腾kaldi,在这个庞大的系统面前,自己是那么的微小。由于数据库的原因,我只能运行kaldi所给例子的一部分。下面就来说说最近的进展吧。     第一个例子就是yesno这个例子。由于提供数据,而且数据比较小,可以非常容易的去实现这个例子。具体的可以见我之前的博客:语音识别工具箱之kaldi介绍。     第二个例子是rm里面的s4。具体的步骤也很简单,首先运行./getd

2013-12-21 18:45:21 38192 3

原创 语音识别系统之kaldi-----安装续

Kaldi下载和安装首先下载kaldi:在命令行中输入:svn co svn://svn.code.sf.net/p/kaldi/code/trunk kaldi-trunk如果出现类似下面的界面,那你就慢慢等待吧……最后完成时出现的界面:至此,你成功的下载了kaldi了。赶紧去目录下查看下吧。    安装:先回到tool目录下,在命令行输入:m

2013-12-13 20:15:04 9606 2

原创 总结和展望-----开题后

前一段时间,应该是10 到15天前开始吧,一直在忙我的硕士开题。从一开始定方向开始到最后确定方向,我还是觉得自己挺对不起自己的。   先从开题的方向说起吧,原来我一直以为自己可以做语音识别。从研一开始,实验室给我的感觉是有语音识别这个方向。我也从那开始接触了语音识别,我基本把大部分时间都注意到这个上面去了。包括最近很火的深度学习。我这个人一直对模型和数学比较感兴趣吧,这也我无时不刻的对机器学习

2013-12-07 19:57:00 1765 1

转载 公开课笔记大盘点

转自:http://blog.coursegraph.com/公开课笔记大盘点网上散落了很多同学的公开课学习笔记,这里就尝试来做一些汇总和整理,也欢迎大家提供线索。1、Coursera上Andrew Ng老师的”机器学习公开课(Machine Learning)”课程图谱上的明星课程,关注人数最多,评论最多,并且网上这门课程的笔记也是相当的多:1)@小小人_

2013-12-06 22:57:54 1557

原创 语音识别工具箱之kaldi介绍

最近有几个人在群里问我kaldi的问题,不巧的是最近我在忙我的开题。我对kaldi的了解也就是语音识别+深度学习。如果不是kaldi有dnn模型,或许我更愿意用htk吧。其实,基本的都差不多吧。kaldi可以说是更加丰富吧。本来准备开题开语音识别,但是由于导师的反对,不得不做现在的歌曲人声分离。进入到这个新的领域,我不得不怀疑自己的学习能力,现在的我变的不淡定了。很久没有写博文,也许很忙,也许自己

2013-12-04 19:38:32 26611 11

语音识别kaldi安装

语音识别系统之kaldi安装。里面有具体步骤,欢迎下载。

2013-12-13

julius-4.2.3

语音识别工具箱 非常好用的,可以自行运行 不懂的私信我

2013-10-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除