自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

牧羊女

北海虽赊,扶摇可接;东隅已逝,桑榆非晚。

  • 博客(216)
  • 资源 (1)
  • 收藏
  • 关注

原创 WeNet训练流程整理

关于WeNet的训练,官方已经给出了比较详细的步骤,不过实际在使用的时候,还是多少会踩几个坑,所以这里就结合官网推荐步骤以及自己的经验,来整理一下训练流程。我用的是AIShell数据集,所以这里就以AIShell为例来说明。但由于数据集过大,并且中间一定会出错,因此建议大家还是一步一步分开执行。

2024-08-26 17:36:40 1294

原创 WeNet模型学习笔记

WeNet是一个端到端语音识别模型,由于其优越的特性,成为近几年语音识别领域的热门模型。WeNet模型是一种CTC和attention结构的混合体,以Conformer或Transformer作为encoder,并使用attention decoder对CTC的输出进行重新打分(rescore)。此外,为了在统一的模型中实现流式与非流式推理,该网络还引入了基于动态块的注意力机制,使得attention可以关注不同长度的上下文。WeNet论文共两篇,对应WeNet模型结构的两个版本。

2024-08-16 17:49:44 1517

原创 语音识别FBank特征提取学习笔记

语音识别就是把一段语音信号转换成对应的文本信息,这一过程包括四个大的模块,分别是:特征提取、声学模型、语言模型、字典与解码。本篇就来梳理一下特征提取模块的实现思路和方法。基于深度学习网络的语音识别,目前多采用FBank特征。

2024-07-04 15:03:08 1602

原创 在Ubuntu上安装Anaconda之后,启动失败

出现以下错误地解决方法:conda: error: argument COMMAND: invalid choice: 'activate' (choose from 'clean', 'compare',

2024-05-09 21:20:45 586

原创 pyx文件在Python中的应用

简单示例说明pyx文件在python中的使用。

2024-04-03 16:10:41 2097 1

原创 RuntimeError: espeak not installed on your system

解决Python程序报错:espeak not installed on your system

2024-04-03 14:10:22 1282

原创 Transformer模型的Pytorch实现

Transformer模型的Pytorch实现解读。

2024-03-15 19:42:32 2010 2

原创 详细理解Transformer

Tansformer的完整解读

2024-03-13 15:15:51 1084

原创 Transformer中Self-Attention的详细解读

对Transformer中Self-attention的详细解读

2024-03-08 11:13:05 965

原创 cannot import name ‘Iterator‘ from ‘torchtext.data‘

解决由于torchtext版本不对引起的报错:cannot import name 'Iterator' from 'torchtext.data'

2024-02-29 17:09:28 533

原创 LSTM学习笔记

LSTM模块的Pytorch实现

2024-01-20 18:35:40 1101

原创 OCR识别网络CRNN理解与Pytorch实现

CRNN论文理解及代码实现

2024-01-19 18:28:44 2087

原创 Paddle模型转ONNX

PaddlePaddle模型转ONNX方法

2024-01-12 18:26:59 1498

原创 PyTorch随机数生成:torch.rand,torch.randn,torch.randind,torch.rand_like

pytorch中几个随机函数的定义和用法整理。

2023-12-22 16:40:25 5201

原创 利用NVIDIA DALI读取视频帧

NVIDIA DALI的介绍和基础用法

2023-11-17 18:32:43 1507 4

原创 RGB转Bayer,一个小数点引发的血案

一个看似无关紧要的小数点引起的数据全错。

2023-11-15 18:12:30 376

原创 Pytorch图像模型转ONNX后出现色偏问题

本篇记录一次从Pytorch图像处理模型转换成ONNX模型之后,在推理过程中出现了明显色偏问题的解决过程。

2023-11-03 18:43:07 754

原创 视频去噪网络BSVD的实现

前些天写了视频去噪网络BSVD论文的理解,详情请点击,这两个星期动手实践了一下,本篇就来记录一下这个模型的实现。这个网络的独特之处在于,它的训练和推理在实现上有所差别。在训练阶段,其使用了TSM(Time Shift Module)结构,而在推理时则使用了BBB(Bidirectional Buffer Block)结构。训练时,网络是一个MIMO(多输入多输出)形式,而在推理时,则将其设计成了单输入、单输出的流式形式。

2023-10-23 21:05:07 853 1

原创 BSVD论文理解:Real-time Streaming Video Denoising with Bidirectional Buffers

BSVD论文理解

2023-09-28 16:33:29 722

原创 dlopen “libnvcuvid.so“ failed!

dlopen "libnvcuvid.so" failed! 的解决方法

2023-09-02 15:42:20 677

原创 常用激活函数整理

整理常见神经网络激活函数

2023-09-01 19:04:01 273

原创 Windows11系统安装CUDA和CuDNN

Windows11系统上的CUDA和CuDNN环境配置。

2023-08-23 16:19:37 1709

原创 Pytorch QAT for UNet

模型的QAT过程

2023-06-20 14:53:24 1836 15

原创 《计算之魂》读书笔记——递归与堆栈的关系

递归与堆栈的关系

2023-06-18 22:02:41 254

原创 《计算之魂》读书笔记——第2章,从递推到递归

递归思想的应用

2023-06-16 21:39:04 472

原创 Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

发现打印出来是CPU,说明模型还在CPU上,没有load到cuda。看意思应该是有些tensor在cuda上,有些tensor在cpu上,需要将两者统一起来。

2023-06-16 18:37:51 1023

原创 《计算之魂》读书笔记——第一章

《计算之魂》第一章读书笔记。

2023-06-10 17:27:17 827

原创 《计算之魂》读书笔记——引子

《计算之魂》读书笔记

2023-06-06 14:52:18 161

原创 Windows动态链接库的生成和使用

Windows上编译并调用C++动态链接库的方法。

2023-06-03 19:09:11 2392

原创 C++使用filesystem的directory_iterator遍历文件

使用filesystem实现指定目录的文件遍历。

2023-05-17 17:48:53 6584

原创 Ubuntu安装X265+FFMPEG

Ubuntu20安装X265+FFMPEG全过程。

2023-03-16 18:26:28 2036

原创 libgomp-d22c30c5.so.1.0.0:cannot allocate memory in static TLS block

libgomp-d22c30c5.so.1.0.0:cannot allocate memory in static TLS block 问题的处理及遗留。

2023-02-23 18:53:55 2107 9

原创 Ubuntu系统为程序创建桌面快捷方式

Ubuntu为程序创建桌面快捷方式的方法

2023-02-15 10:43:03 3046

原创 模型量化I—基础概念

模型量化基础及模型量化的分类

2023-02-01 11:12:34 928

原创 “Torch not compiled with CUDA enabled“

解决"Torch not compiled with CUDA enabled"错误的过程。

2023-01-19 20:19:16 1067

原创 AI芯片的性能评价

AI芯片

2022-11-02 21:00:59 3651

原创 笔记:AI芯片的算法优化II

AI芯片算法的优化方向,第二部分。

2022-10-26 20:46:06 1235 1

原创 笔记:AI芯片的算法优化

AI芯片算法优化的几种思路。

2022-10-24 19:55:45 2302

原创 C4996 ‘localtime‘: This function or variable may be unsafe.

解决C4996 localtime错误的方法。

2022-10-21 12:02:23 3860

原创 笔记:AI芯片的未来创新方向

AI芯片创新方向

2022-10-20 21:09:45 1182

spdlog_based_api.rar

封装了一套spdlog接口,可以实现日志打印的控制台输出、文件输出、或控制台+文件同时输出。资源含接口源码及测试代码。spdlog版本为spdlog-1.5.0。

2021-06-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除