- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是:1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell2.gale_mandarin: 中文新闻广播数据集(LDC2013S08, LDC2013S08)3.hkust: 中文电话数据集(LDC2005S15, LDC2005T32)4
2017-12-31 22:57:58 48446 11
原创 Kaldi学习笔记(二)——实例yesno和timit的应用
Kaldi的安装与编译请参考:Kaldi的安装与编译Kaldi的例子有很多,在egs目录下面,对Kaldi不熟悉的小白们可以先从yesno和timit两个例子入手,这样可以对Kaldi有个直观的认识。一、运行yesno实例该实例是一个非常小的数据集,每一条记录都是一系列yes或者no的语音,标注是由文件名来标注的。先运行一下。切换到./egs/yesno/s5目录下,运行sudo.
2017-12-27 17:37:59 8926 5
原创 Kaldi学习笔记(一)——Kaldi的下载安装与编译
Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。本次我是在虚拟机装上了Ubuntu。文档里面也说还是建议在Linux下使用Kaldi。一、下载下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下输入命令:git clone https://github.com/kaldi-asr/kaldi.g
2017-12-25 21:08:01 22739 6
原创 特征选择——卡方检验(使用Python sklearn进行实现)
在看这篇文章之前,如果对卡方检验不熟悉,可以先参考:卡方检验Python有包可以直接实现特征选择,也就是看自变量对因变量的相关性。今天我们先开看一下如何用卡方检验实现特征选择。1. 首先import包和实验数据:from sklearn.feature_selection import SelectKBestfrom sklearn.feature_selection import
2017-12-21 19:44:32 51970 7
转载 R语言——中文分词包jiebaR
R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要
2017-12-18 20:38:42 17044 1
原创 R语言——UTF-8各种问题解决方法
R语言在碰到读UTF-8文件,或者处理UTF-8数据时总是会遇到各种各样的问题,本姑娘也是在碰了n多次壁,被气得吐血好多次之后,终于对这类总结出了一些解决办法:1. 读UTF-8文件,例如UTF-8格式的csv:最好的处理办法就是:a1=read.table('C:\\test11.csv',sep=',',fileEncoding = 'UTF-8',header = F)如果使
2017-12-14 20:31:26 57229 2
原创 统计学——卡方检验和卡方分布
什么是卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。例子1:四格卡方检验...
2017-12-11 13:02:37 220924 47
用牛顿法和弦截法求解线性方程
2012-05-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人