![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
wenet
文章平均质量分 67
少游223
语音识别算法
展开
-
动态batch和静态batch的原理和代码详解
在wenet中支持两种batch的方式,第一种是常规的batch方案,但该方案当语音长短差异过大时,显存利用率低,同时带来显存oom的风险;第二种是动态batch,不指定batch_size的大小,只限制了batch中的最大总帧数,这样就能够充分利用显存,同时不会有内存oom的风险。原创 2022-01-22 20:03:41 · 4553 阅读 · 0 评论 -
wenet mask原理解析
该程序主要对wenet使用的mask原理进行分析原创 2022-01-22 19:27:53 · 2466 阅读 · 0 评论 -
wenet动态chunk的设计逻辑
本文主要介绍wenet的动态chunk设计技巧原创 2022-01-22 19:19:16 · 3701 阅读 · 0 评论 -
wenet/utils/mask.py代码理解
本文主要是对wennet中wenet/utils/mask.py代码注解原创 2022-01-01 21:22:07 · 1752 阅读 · 0 评论 -
wenet 频谱增强的原理和代码实现
原理:该方法实在u2++中作为第二个创新点提出的,其作用是使模型见多识广,更加robust。主要思路是随机用之前的chunk来代替当前的chunk。论文位置:https://arxiv.org/pdf/2106.05642.pdf详见文章的3.2.3小结代码位置:https://github.com/wenet-e2e/wenet/blob/main/wenet/dataset/dataset_deprecated.py代码分析:————————————_spec_aug_me.原创 2021-12-27 23:19:49 · 1678 阅读 · 0 评论