2013年12月_wbglearn

原创跨年巨献-----timit数据库下载（不再提供下载）

上次在博文语音识别系统之htk-----连续语音识别中提到，一旦确认自己下载的timit是完整的，就会给大家的。前几天，有人在群里问timit数据库的事情，后来无意找到在linux下用命令下载，终于把http://www.fon.hum.uva.nl/david/ma_ssp/2007/TIMIT/下载完整。现在上传给大家，本来打算放csdn下载里，但比较麻烦。现在直接放我百度网盘里。希望对你

2013-12-31 20:41:44 12979 22

转载几个常见的语音交互平台的简介和比较

由于自己上次可能没写好，这次突然见到这个，就转载到这里。转载：http://ibillxia.github.io/blog/2012/11/24/several-plantforms-on-audio-and-speech-signal-processing/几个常见的语音交互平台的简介和比较1.概述最近做了两个与语音识别相关的项目，两个项目的主要任务虽然都是语音识别，或者更确

2013-12-31 00:02:37 3502

原创语音识别工具箱综述和产品介绍

今天是周末，想来想去，还是写一篇这样的博文吧。算是对语音识别这一段时间的总结，为后来的人融入铺好前面的路。这个只是工具箱的综述，不是语音识别的综述。希望您有所收获。目前，语音识别领域公开的开源的代码或者说工具箱有：sphinx，htk，julius，kaldi。也许也有其他的吧。下面我尽量一一介绍：1.sphinx：这个是李开复的博士论文。后面不断的壮大，有了后来的版本。这个比较小

2013-12-29 16:42:12 3352 2

原创语音识别系统之htk-----连续语音识别

在零落_World的合作下，终于完成了htk实现连续语音识别的一个流程。中间遇到了很多不大不小的问题。具体的可以见： 1.

2013-12-29 15:00:59 11129 8

转载 TIMIT语音库-----下载和matlab读取

TIMIT语音库为大多数论文及研究中常用的语音库，适用于语音识别、说话人识别等语音信号处理。在MIT网站可以找到一些样例，为 16kHz sampling, 16 bit sample, PCM encoding。样例才160个句子，不够用。这儿能找到完整版，用抓取工具全部下载下来有600多M但问题是虽然其为wav结尾，matlab中wavread却读不了，用二进制打开文件发现

2013-12-25 11:37:07 10442 8

原创语音识别系统之htk------孤立词识别（yesno）

孤立词的识别应该是最基础了，搭完htk的环境和安装好，首先就应该实验下。网上这方面的介绍也很多，大家可以去参考参考。下面就是整个过程：一数据准备说明：由于自己的linux操作系统不支持麦克风输入。所以在windows下准备数据。下午折腾了下，感觉比较麻烦。网上说需要安装oss，但是我的ubuntu版本似乎没找到对应的版本，我还是放弃了。这个是后话了。如果大家有什么更好的办法，可以告

2013-12-24 20:27:23 6033 1

这篇博客本来应该在很早之前就写出来，但一直被耽搁了。今天把上一个项目的事情结束了，从明天开始，我就开始我的开题---基于歌声的音乐分离。通俗的说就是去掉我们听的音乐里的人声，把伴奏留下。但愿我可以把这个事情做的很好吧。算给自己个好好的交代，但是我不会忘记语音识别这个事情。毕竟我研一花了那么多的时间，实验室不支持也没事，坚持做自己喜欢，牺牲下自己的课余时间就可以了。好了，言归正转。明天圣诞节了，大家

2013-12-24 19:12:00 1930 1

原创语音识别系统之kaldi------voxforge实例

首先来介绍下voxforge。voxforge是个收集语音的网址，你可以免费的得到

2013-12-24 18:59:41 12164

原创语音识别系统kaldi----实例说明

最近一直在折腾kaldi，在这个庞大的系统面前，自己是那么的微小。由于数据库的原因，我只能运行kaldi所给例子的一部分。下面就来说说最近的进展吧。第一个例子就是yesno这个例子。由于提供数据，而且数据比较小，可以非常容易的去实现这个例子。具体的可以见我之前的博客：语音识别工具箱之kaldi介绍。第二个例子是rm里面的s4。具体的步骤也很简单，首先运行./getd

2013-12-21 18:45:21 38192 3

原创语音识别系统之kaldi-----安装续

Kaldi下载和安装首先下载kaldi:在命令行中输入：svn co svn://svn.code.sf.net/p/kaldi/code/trunk kaldi-trunk如果出现类似下面的界面,那你就慢慢等待吧……最后完成时出现的界面:至此,你成功的下载了kaldi了。赶紧去目录下查看下吧。安装：先回到tool目录下，在命令行输入：m

2013-12-13 20:15:04 9606 2

原创总结和展望-----开题后

前一段时间，应该是10 到15天前开始吧，一直在忙我的硕士开题。从一开始定方向开始到最后确定方向，我还是觉得自己挺对不起自己的。先从开题的方向说起吧，原来我一直以为自己可以做语音识别。从研一开始，实验室给我的感觉是有语音识别这个方向。我也从那开始接触了语音识别，我基本把大部分时间都注意到这个上面去了。包括最近很火的深度学习。我这个人一直对模型和数学比较感兴趣吧，这也我无时不刻的对机器学习

2013-12-07 19:57:00 1765 1

转载公开课笔记大盘点

转自：http://blog.coursegraph.com/公开课笔记大盘点网上散落了很多同学的公开课学习笔记，这里就尝试来做一些汇总和整理，也欢迎大家提供线索。1、Coursera上Andrew Ng老师的”机器学习公开课(Machine Learning)”课程图谱上的明星课程，关注人数最多，评论最多，并且网上这门课程的笔记也是相当的多：1）@小小人_

2013-12-06 22:57:54 1557

原创语音识别工具箱之kaldi介绍

最近有几个人在群里问我kaldi的问题，不巧的是最近我在忙我的开题。我对kaldi的了解也就是语音识别+深度学习。如果不是kaldi有dnn模型，或许我更愿意用htk吧。其实，基本的都差不多吧。kaldi可以说是更加丰富吧。本来准备开题开语音识别，但是由于导师的反对，不得不做现在的歌曲人声分离。进入到这个新的领域，我不得不怀疑自己的学习能力，现在的我变的不淡定了。很久没有写博文，也许很忙，也许自己

2013-12-04 19:38:32 26611 11

u010384318的专栏