每日记录
翁卓
这个作者很懒,什么都没留下…
展开
-
kaldi-gop
shell脚本位置kaldi-master/egs/gop/s5/run.sh跑完log:feat-to-len scp:../s1/data/test-1000_hires/feats.scp ark,t:data/test_10short/tmp.len utils/subset_data_dir.sh: reducing #utt from 1000 to 10steps/nnet3/compute_output.sh --cmd run.pl --nj 1 --online-ivect原创 2020-09-22 20:53:55 · 1319 阅读 · 3 评论 -
kaldi cmvn
cur_sum.AddRowSumMat(1.0, input_part , 0.0); // input 列求和得到cur_sumcur_sumsq.AddDiagMat2(1.0, input_part, kTrans, 0.0); //Add the diagonal of a matrix times itself *this = diag(M^T M) + beta * *this (if trans == kTrans).variance.Scale(1.0 / window_f...原创 2020-09-14 00:29:03 · 254 阅读 · 0 评论 -
gstreamer
mp3 转 wavgst-launch-1.0 filesrc location=1.mp3 ! decodebin ! audioresample \! audioconvert ! audio/x-raw,format=S24LE,rate=48000 ! wavenc \! filesink location=out.wav利用speex 编解码 插件:源代码出自https://stackoverflow.com/questions/32564312/problems-with-us原创 2020-09-09 19:55:58 · 216 阅读 · 0 评论 -
音频知识点
ll *.mp3-rw-rw-r-- 1 joe joe 39204 7月 30 13:44 0000452f-5aff-4a48-b9a9-4e24218753a1.mp3-rw-rw-r-- 1 joe joe 30062 7月 30 19:46 9945b5b6-7b3c-4d7e-9d68-7d82953d124f.mp3-rw-rw-r-- 1 joe joe 8672 7月 29 19:43 b81fc3c5-6dfd-4176-b9ee-d107f3a12763.mp3fi.原创 2020-08-03 11:02:54 · 397 阅读 · 0 评论 -
shell编程计算1-1000中所有3或5的倍数之和
#!/bin/bashsum=0 int=1while((int<=1000))do if (( $int%3==0 )) || (( $int%5==0 ));then sum=$((sum+int)) fi let int++doneecho $sum; #!/bin/bash sum=0for((i=1;i<=1000;i++));do if (( $i%3==0 )) || (( $i%5==0 ));then ..原创 2020-07-07 15:08:33 · 2902 阅读 · 0 评论 -
master_worker
见过很多获取服务器本地IP的代码,个人觉得都不是很好。从网上搜索到一个靠谱的脚本,分享一下!通过 UDP 获取本机 IP,目前见过最优雅的方法这个方法是目前见过最优雅获取本机服务器的IP方法了。没有任何的依赖,也没有去猜测机器上的网络设备信息。而且是利用 UDP 协议来实现的,生成一个UDP包,把自己的 IP 放如到 UDP 协议头中,然后从UDP包中获取本机的IP。这个方法并不会真实的向外部发包,所以用抓包工具是看不到的。但是会申请一个 UDP 的端口,所以如果经常调用也会比较耗时的,这里转载 2020-06-27 18:54:06 · 372 阅读 · 0 评论 -
录音切分
m4a 及其他转MP3 流程首先 ffmpeg 转成wavffmpeg -y -i apple.m4a -ac 1 -ar 16000 apple.wav # 苹果m4a格式 转成 单通道 16k采样率 的wav格式音频lameapple.wav apple.mp3切分录音:sox apple.wav apple_1.wav trim 0 5.5 # 对apple.wav 切分0s到 5.5s部分sox apple.wav apple_1.wav trim 62...原创 2020-06-05 10:41:04 · 361 阅读 · 0 评论 -
实时语音识别GStreamer+kaldi 搭建介绍
一.搭建 见博客 http://www.luyixian.cn/news_show_274565.aspx二. 结构 1) master worker client 利用websocket交互 2) gst 数据流媒体框架 3) kaldi 模块,先不介绍三. ws4py websocket 官方文档:https://ws4py.readthedocs.io/en/latest/sources/requirements/ ...原创 2020-05-26 21:13:55 · 779 阅读 · 0 评论 -
docker 学习
启动容器:docker run ubuntu:15.10 /bin/echo "Hello world"查看运行:docker psrunoob@runoob:~$ docker psCONTAINER ID IMAGE COMMAND ... 5917eac21c36 ubuntu:15.10 "/bin/sh -c 'while t…" ...CONTAINE.原创 2020-05-22 21:03:56 · 129 阅读 · 0 评论 -
20190911
ipcs -mps -aux | grep 8895python worker.py -u ws://localhost:8895/worker/ws/speech -c conf/asr_worker.yaml原创 2019-09-11 16:48:57 · 95 阅读 · 0 评论 -
数据读取,去除中文字母数字之外符号,并分词
# encoding=utf-8import jiebaimport optparseimport re,codecsdef main(): parser = optparse.OptionParser() parser.add_option('--kunpeng-txt', type=str, help='') parser.add_option("--ku...原创 2019-07-25 20:18:13 · 1178 阅读 · 0 评论 -
解码流程
语料位置:133 :/mnt/data3/wangqq/16_208_backup/workspace/wangqq/lm_training/G生成语言模型:arpa2fst --disambig-symbol=#0 --read-symbol-table=$lang/words.txt - data/lang${lang_suffix}_test_bd_tgpr/G.fst构图...原创 2019-07-25 14:29:11 · 157 阅读 · 0 评论 -
语言模型
ngram语言模型有两个难以逾越的鸿沟,数据稀疏与缺乏长距离语言约束rnn:可以获得长距离信息,但是很难获得风场距离的信息,理由是随着长度的增加,远距离信息通过概率相乘的结果趋向于零kaldi rnnlm 学习向量层:将词汇表嵌入到一个固定维度的实数空间中,有两个作用:降低输入的维度,增加语义信息。softmax层:将循环神经网络的输出转化为一个单词表中每个单词的输出概率。包...原创 2019-07-10 13:56:08 · 439 阅读 · 0 评论 -
table处理
awk -F'\t' '{if($8!="") print $0}' file >file_selectsplit -l 30000 528Conversion_information_table.csv -d -a 3 528Conversion_information_table原创 2019-05-29 17:27:58 · 84 阅读 · 0 评论