语音识别学习资料入门整理

0.概念:

语音信号处理/模式识别/统计分析,

1.算法:

常用的深度学习算法,包括
cnn/dnn/rnn/lstm;
GMM/SVM/CRF/MaxEnt/HMM;
对CTC 有经验;

2.框架:

熟悉至少一种深度学习框架,包括 kaldi, tensorflow, caffe, mxnet 等;
常用工具如 Caffe, CNTK, TensorFlow, Pytorch, Kaldi, CTC 技术
熟握 Kaldi, SRiLM, RNNLM, TensorFlow 等社区开源工具中的一种及以上

3.语言:

精通C/C++,Python,Shell编程语言,对数据结构和算法设计有深刻理解;
熟悉C/C++或Python等任意一种编程语言

4.paper:

在学术会议期刊发表过相关论文者优先,有算法优化经验者优先
在相关国际会议或主流期刊上发表论文者优先(ICASSP,Interspeech,ASRU)
在Interspeech,ICASSP等语音学术会议中有论文发表者优先。

4.领域:

计算机、信号处理、自动化


http://www.inf.ed.ac.uk/teaching/courses/asr/

视频:數位語音處理概論

http://ocw.aca.ntu.edu.tw/ntu-ocw/ocw/cou/104S204/1

https://book.douban.com/review/8658211/#comments

  • 1
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值