自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 声纹验证和声纹识别中的AS-norm、Z-norm、T-norm、ZT-norm、 S-norm操作

声纹验证和声纹识别中的AS-norm、Z-norm、T-norm、ZT-norm、 S-norm操作

2022-11-28 16:01:42 1522

原创 mac 解决“zsh: no matches found“的问题

mac 解决“zsh: no matches found“的问题

2022-10-21 17:29:02 1326

原创 torch.save() 函数讲解 保存不同类型的model,model.state_dict()格式

torch.save() 函数讲解 保存不同类型的model,model.state_dict()格式

2022-05-24 10:54:03 4638

原创 smop 模块将matlab代码转化为python

smop 模块将matlab代码转化为python

2022-04-26 14:38:16 3549 15

原创 python采用 os.walk 读取文件的数目

python采用 os.walk 读取文件的数目

2022-04-24 17:41:38 1342

原创 nn.Parameter 详解 (将 nn.Parameter 用于 nn.init.kaiming_normal 初始化)

nn.Parameter 详解 (nn.Parameter用于 nn.init.kaiming_normal 初始化)

2022-04-04 15:30:54 3199

原创 torch.squeeze() 的用法 x.squeeze(2)不会对原Tensor操作?

官方文档介绍:torch.squeeze(input, dim=None, out=None)将输入张量形状中的1 去除并返回。 如果输入是形如(A×1×B×1×C×1×D),那么输出形状就为: (A×B×C×D)。当给定dim时,那么挤压操作只在给定维度上。例如,输入形状为: (A×1×B), squeeze(input, 0) 将会保持张量不变,只有用 squeeze(input, 1),形状会变成 (A×B)。注意: 返回张量与输入张量共享内存,所以改变其中一个的内容会改变另一个。特别注意:

2022-04-04 14:24:03 1736

原创 对于Gitlab项目的Developer权限问题 (Guest,Reporter,Developer,Maintainer)

对于Gitlab项目的Developer权限问题 (Guest,Reporter,Developer,Maintainer)

2022-03-22 16:27:00 6272

原创 使用pip安装依赖时出现 timed out 的情况 如何解决?

使用pip安装依赖时出现 timed out 的情况 如何解决?

2022-03-22 11:19:54 2259

原创 Linux环境下如何使用 ffmpeg 处理音视频的合成问题

问题描述提示:这里描述项目中遇到的问题:在做语音、视频合成时候可以用ffmpeg来解决!解决方案:1、将原视频的音频去除ffmpeg -i 原视频.mp4 -vcodec copy -an 去音频的视频.mp42、加入新的音频ffmpeg -i 去音频的视频.mp4 -i 新的音频.mp3 -vcodec copy -acodec copy 新合成的视频.mp4如果是Windows系统,只需将 ffmpeg改为ffmpeg.exe即可。自定义目录标题)欢迎使

2022-03-18 14:09:45 2555

原创 关于Docker 报错 问题 ERROR:This script does not work on python 3.5 The minimum supported Python version

关于Docker报错问题 ERROR:This script does not work on python 3.5 The minimum supported Python version is 3.7

2022-03-15 17:01:01 5196

AISHELL-3数据集

AISHELL-3 is a large-scale and high-fidelity multi-speaker Mandarin speech corpus published by Beijing Shell Shell Technology Co.,Ltd. It can be used to train multi-speaker Text-to-Speech (TTS) systems.The corpus contains roughly 85 hours of emotion-neutral recordings spoken by 218 native Chinese mandarin speakers and total 88035 utterances. Their auxiliary attributes such as gender, age group and native accents are explicitly marked and provided in the corpus. Accordingly, transcripts in Chines

2022-06-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除