ASR
文章平均质量分 62
翁卓
这个作者很懒,什么都没留下…
展开
-
letter2phone
https://www.aclweb.org/anthology/P10-1080.pdf原创 2020-10-26 20:52:55 · 154 阅读 · 0 评论 -
20190911
ipcs -mps -aux | grep 8895python worker.py -u ws://localhost:8895/worker/ws/speech -c conf/asr_worker.yaml原创 2019-09-11 16:48:57 · 110 阅读 · 0 评论 -
20190827
质检数据筛选:/home/homework/wangshenjian/daily_zhijian_collect发送:192.168.240.104(test-09机器):disk2/wangshenjian/upload /home/homework/bce-cli-0.8.3/bce bos cp 20190728.res bos://zyb-video/20...原创 2019-08-27 21:27:45 · 174 阅读 · 0 评论 -
20190702
fst文档:SPEECH RECOGNITIONWITHWEIGHTED FINITE-STATE TRANSDUCERSEfficient WFST-Based One-Pass Decoding With On-The-Fly Hypothesis Rescoring in Extremely Large Vocabulary Continuous Speech Recognition...原创 2019-07-02 15:36:12 · 130 阅读 · 0 评论 -
0613
mysql查询时间select * from files where fname=date_format(date_sub(curdate(),interval 2 day),'%Y%m%d');mysql> select * from files where date_format(date_sub(curdate(),interval 2 day),'%Y%m%d');+----...原创 2019-06-13 16:51:35 · 224 阅读 · 0 评论 -
0612
insert overwrite directory "bos://zyb-offline/user/wangzhou/sale_staff"select id, sc_uid, leads_id, course_id, trans_time from homework_zhibo_laxindata_tblsctrans where dt="20190611"select id, s...原创 2019-06-12 20:28:39 · 168 阅读 · 0 评论 -
WFST 动态解码
WFST:Speech recognition with weighted finite-state transducers静态解码:动态解码:Look-Ahead Composition,On-the-fly RescoringLook-Ahead Composition二者比较:《A comparison of dynamic WFST decoding approa...原创 2019-05-18 21:40:03 · 947 阅读 · 0 评论 -
on-the-fly 动态解码
1.静态解码:compositiondeterminizationminimization2. 语言模型重评估:文章《电话交谈语音识别中基于LSTM-DNN语言模型的重评估方法研究》声学模型只能识别语音信号中音素、音节、或者词的相似程度,但不能捕捉到词与词之间的相关性。语言模型则可以利用不同的上下文关系,或者其他语言学信息来预测每一个词可能发生的概率。可以解决声学模型混...原创 2019-05-18 15:26:37 · 1470 阅读 · 0 评论 -
kaid mfc特征
计算13维度特征if [ $stage -le 6 ]; then for part in call_center_26s; do steps/make_mfcc.sh --cmd "$train_cmd" --nj 1 data/$part exp/make_mfcc/$part $mfccdir steps/compute_cmvn_stats.sh data/$pa...原创 2019-05-22 15:22:36 · 186 阅读 · 0 评论 -
Kaldi解码
online2-wav-nnet3-latgen-faster 在线解码,文件输入输出decode.sh运行程序./online2-wav-nnet3-latgen-faster --do-endpointing=false --frames-per-chunk=20 --extra-left-context-initial=0 --online=true --confi...原创 2019-05-14 21:02:01 · 1618 阅读 · 1 评论 -
输出交叉熵值
#!/bin/bashrm result_train_6epoch.outrm result_valid_6epoch.outfor x in `seq 0 264`;do grep 'output' compute_prob_train.${x}.log |awk '{print $8;}' >> result_train_5epoch.out ...原创 2019-01-16 19:05:35 · 269 阅读 · 0 评论 -
-bash: /bin/mv: Argument list too long mv
把labels下的所有文件mv到img文件夹下:mv labels/* img/报错:-bash: /bin/mv: Argument list too long mv原因是*批处理参数太多解决办法: find labels -name '*.*' | xargs mv --target-directory=img ...原创 2019-01-22 15:13:53 · 233 阅读 · 0 评论 -
OpenFst
OpenFst is a library for constructing, combining, optimizing, and searching weighted finite-state transducers (FSTs)in2019.1.25需要学习内容:语音识别:解码文本分类:词向量模型,双向循环神经网络对抗网络(GAN):...原创 2019-01-25 17:57:13 · 728 阅读 · 0 评论 -
2019年1月
语音识别两条路:传统方法:GMM+HMM,DNN+HMM,kaldi工具实现神经网络:CTC(Connectionist Temporal Classification)框架(deepspeech2, 科大讯飞DFCNN),注意力机制的 seq2seq 框架(谷歌的LAS)俞栋所说:“只有当新模型比旧模型好很多的时候,替换才会发生。当然,这里的好是多方面的,不单单是识别率好,也可能是在...原创 2019-01-19 16:03:40 · 171 阅读 · 0 评论 -
语言模型训练
模型训练:nohup ngram-count -text tieba.word.merged -order 4 -vocab ../words.txt -kndiscount -interpolate -lm tieba.word.4gram.lm &结果测试:ngram -lm tieba.word.4gram.lm -ppl ../baiduLabel300h_201...原创 2019-01-18 09:51:13 · 646 阅读 · 0 评论 -
Tmux分屏软件
Ctrl+b " - split pane horizontallyCtrl+b % - 将当前窗格垂直划分Ctrl+b 方向键 - 在各窗格间切换Ctrl+b,并且不要松开Ctrl,方向键 - 调整窗格大小Ctrl+b c - (c)reate 生成一个新的窗口Ctrl+b n - (n)ext 移动到下一个窗口Ctrl+b p - (p)revious 移动到前一个窗口.Ctrl...原创 2018-11-07 11:34:30 · 218 阅读 · 0 评论