- 博客(216)
- 资源 (1)
- 收藏
- 关注
原创 WeNet训练流程整理
关于WeNet的训练,官方已经给出了比较详细的步骤,不过实际在使用的时候,还是多少会踩几个坑,所以这里就结合官网推荐步骤以及自己的经验,来整理一下训练流程。我用的是AIShell数据集,所以这里就以AIShell为例来说明。但由于数据集过大,并且中间一定会出错,因此建议大家还是一步一步分开执行。
2024-08-26 17:36:40 1294
原创 WeNet模型学习笔记
WeNet是一个端到端语音识别模型,由于其优越的特性,成为近几年语音识别领域的热门模型。WeNet模型是一种CTC和attention结构的混合体,以Conformer或Transformer作为encoder,并使用attention decoder对CTC的输出进行重新打分(rescore)。此外,为了在统一的模型中实现流式与非流式推理,该网络还引入了基于动态块的注意力机制,使得attention可以关注不同长度的上下文。WeNet论文共两篇,对应WeNet模型结构的两个版本。
2024-08-16 17:49:44 1517
原创 语音识别FBank特征提取学习笔记
语音识别就是把一段语音信号转换成对应的文本信息,这一过程包括四个大的模块,分别是:特征提取、声学模型、语言模型、字典与解码。本篇就来梳理一下特征提取模块的实现思路和方法。基于深度学习网络的语音识别,目前多采用FBank特征。
2024-07-04 15:03:08 1602
原创 在Ubuntu上安装Anaconda之后,启动失败
出现以下错误地解决方法:conda: error: argument COMMAND: invalid choice: 'activate' (choose from 'clean', 'compare',
2024-05-09 21:20:45 586
原创 RuntimeError: espeak not installed on your system
解决Python程序报错:espeak not installed on your system
2024-04-03 14:10:22 1282
原创 cannot import name ‘Iterator‘ from ‘torchtext.data‘
解决由于torchtext版本不对引起的报错:cannot import name 'Iterator' from 'torchtext.data'
2024-02-29 17:09:28 533
原创 PyTorch随机数生成:torch.rand,torch.randn,torch.randind,torch.rand_like
pytorch中几个随机函数的定义和用法整理。
2023-12-22 16:40:25 5201
原创 Pytorch图像模型转ONNX后出现色偏问题
本篇记录一次从Pytorch图像处理模型转换成ONNX模型之后,在推理过程中出现了明显色偏问题的解决过程。
2023-11-03 18:43:07 754
原创 视频去噪网络BSVD的实现
前些天写了视频去噪网络BSVD论文的理解,详情请点击,这两个星期动手实践了一下,本篇就来记录一下这个模型的实现。这个网络的独特之处在于,它的训练和推理在实现上有所差别。在训练阶段,其使用了TSM(Time Shift Module)结构,而在推理时则使用了BBB(Bidirectional Buffer Block)结构。训练时,网络是一个MIMO(多输入多输出)形式,而在推理时,则将其设计成了单输入、单输出的流式形式。
2023-10-23 21:05:07 853 1
原创 BSVD论文理解:Real-time Streaming Video Denoising with Bidirectional Buffers
BSVD论文理解
2023-09-28 16:33:29 722
原创 Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!
发现打印出来是CPU,说明模型还在CPU上,没有load到cuda。看意思应该是有些tensor在cuda上,有些tensor在cpu上,需要将两者统一起来。
2023-06-16 18:37:51 1023
原创 libgomp-d22c30c5.so.1.0.0:cannot allocate memory in static TLS block
libgomp-d22c30c5.so.1.0.0:cannot allocate memory in static TLS block 问题的处理及遗留。
2023-02-23 18:53:55 2107 9
原创 “Torch not compiled with CUDA enabled“
解决"Torch not compiled with CUDA enabled"错误的过程。
2023-01-19 20:19:16 1067
原创 C4996 ‘localtime‘: This function or variable may be unsafe.
解决C4996 localtime错误的方法。
2022-10-21 12:02:23 3860
spdlog_based_api.rar
2021-06-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人