dreaming_hz-CSDN博客

原创毕设-DEMO-Linux+PyAudio+Kaldi的演示程序(一)-PyAudio录音

在摸索了一周安卓开发后，停在了使用AudioRecord进行录音回放的阶段；要完整地将实验系统迁移到移动端还要：Created with Raphaël 2.1.2当前状态：调用AudioRecord捕获音频从AudioRecord填充的数组数据中提取fbank特征迁移Kaldi训练出的音素识别器将fbank特征送入音素识别器，同时在窗上进行DTW打分调整阈值，根据打分结果决定进行关键词检出完成G

2015-06-03 14:00:41 2454

原创毕设-周报-20150520

组会周报

2015-05-20 21:34:19 2490

原创 CV-Build your first deep learning network-识别一只猫

Computer vision - Build your first deep learning network

2015-05-15 21:31:02 673

原创 Paper Review-Fast and Robust Multiframe Super Resolution-#1-"Brain" hang out

Sina Farsiu, M. Dirk Robinson发表在2004年IEEE Trans on Image Processing上的文章的笔记

2015-05-13 22:27:07 1228

原创论文-基于深度学习的语音关键词检出

辗转多处，还是markdown顺手，就在此处pia论文草稿

2015-05-11 20:45:42 4220 1

原创 CV-数数手上资源

掰手指头数数中几个月以来都在继续网络课程的学习，做毕业设计，前天用了一下午把Kaldi ark文件以及抄本信息读取判识后终于出图：在对比结果中应该是10^-2量级的横坐标竟然蹦到几百~~ROC肯定出问题了到时间为CV的内容好好准备一番了：晓晓的图像增强内容找到Coursera上期Image and video processing的材料利用Kaggle上的Julia tutorial实验

2015-05-07 23:19:45 665 1

原创毕业设计- 基于深度神经网络的语音关键词检出系统-上手currennt-1

毕业设计中的一个部分-CURRENNT speech recognition的上手以后还有chime数据源的使用(WSJ)，nc文件转到实时音频的使用，ASR到KWS的转换，静音检测等多项内容要做

2015-05-03 13:31:40 2877 1

原创求一件趁手兵器-上-UBUNTU+CUDA+BOOST+THEANO+CURRENNT+NETCDF+OPENCV配置大杂烩

服务器不是时时能方便地用到，在对墙外的vagrant解决方案失望之后，借着有不限流量的网络资源在此配置一个最近需要的开发环境。编者要用的环境底层需要CUDA支持，安装到Ubuntu系统上，笔记本自带显卡Geforce 425M。(老机器装点什么东西都是提心吊胆~)，在上层装上Theano用于跑深度学习的样例实验，CUrrennT用来跑进行语音识别的神经网络，NETCDF和BOO

2015-05-02 20:56:35 1144

原创求一件趁手兵器-中-UBUNTU+CUDA+BOOST+THEANO+CURRENNT+NETCDF+OPENCV配置大杂烩

昨天的CUDA7装好高兴了好一会，又在编译currennt和opencv2.4的时候被浇了冷水。。。报错内容是-errorunsupported gpu architecture，compute11类似的内容。今早下载cuda6.5-ubuntu12.04-64bit的run包，进入昨天的/opt/cuda-7.0/bin目录下使用 su

2015-05-02 20:48:40 1120

原创毕业设计-基于深度神经网络的语音关键词检出系统-使用python脚本作词频统计-Librispeech

TIMIT之后，这次来分析Librispeech的词频，文件组织结构如图所示：librispeech文件夹下的dev-clean中含有多个多级子文件夹，每个末节文件夹下含有一个txt含有抄本外加多个音频文件是该抄本的朗读：脚本任务是对所有txt抄本读取其中的词数并作统计，抄本内容样例如下其中全部是大写单词，我们的操作分为两步：1.利用os.walk()遍历所有文

2015-05-02 20:21:09 2425

原创毕业设计-基于深度神经网络的语音关键词检出系统-使用python脚本作词频统计-TIMIT

在自己搭建的wordpress小帐蓬里面发了点东西又混回CSDN来了。。由于语音关键词检测需要的数据大都散布在多重文件夹之下，而为针对识别任务组织的文件结构对于关键词检出来讲，训练样本中的词频不同可能对不同词作模版的关键词检出效果产生影响~干脆来做一次词频统计。开始总是希望用WINDOWS下的BAT文件或是LINUX的SHELL脚本作相关工作，然后。。。前者又丑

2015-05-02 18:05:19 1924

原创跳票致歉

最近宅在家里想尽可能地完成些CS50的PSET，萎靡了。。。博客没有定期更，对此次跳票致歉~

2014-12-26 20:41:27 503

原创消化Machine Learning课程-Week1 Introduction

消化Machine Learning课程-Week1 Introduction

2014-12-18 09:29:56 529

dreaming_hz