自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(199)
  • 资源 (5)
  • 收藏
  • 关注

原创 手动构建线性回归(PyTorch)

假设函数、损失函数、优化方法#损失函数:平均损失#优化方法:梯度下降

2024-07-16 22:11:19 437

原创 梯度计算注意事项(pytorch)

使用detach函数将张量分离,再使用numpy函数注意:detach之后会产生一个新的张量,新的张量作为叶子结点,并且该张量和原来的张量共享数据,但是分离后的张量不需要计算梯度。

2024-07-16 19:28:41 116

原创 控制梯度计算(pytorch)

什么时候会用控制梯度计算了,在训练的时候模型需要梯度计算,训练完毕不需要。所以需要控制什么时候计算什么时候不计算。

2024-07-16 19:22:29 311

原创 神经网络基础--网络参数初始化(PyTorch)

网络参数初始化1.均匀分布初始化,权重参数初始化从区间均匀随机取值,即在(-1/根号d,1/根号d)均匀分布中生成当前神经元的权重,其中d为每个神经元的输入数量2.正态分布初始化,随机初始化从均值为0,标准差为1是高斯分布中取样,使用一些很小的值对参数w进行初始化。3.全0初始化,将神经网络中的所有权重初始化为04.全1初始化,将神经网络中所有权重参数初始化为1.5.固定值初始化,将神经网络中所有权重参数初始化为某个固定的值.6..kaiming初始化,也叫做HE初始化,HE初始化分为正态分布的

2024-07-16 19:20:25 341

翻译 音转|Eressive Voice Conversion: A Joint Framework for Speaker Identity and Emotional Style TransferZon

由于StarGAN在多对多语音转换方面的成功,我们扩展了这个想法,并提出了一个多对多的VC框架,它可以共同传递说话者的身份和情感风格,这将在第4节中进一步介绍。据我们所知,这是第一篇研究表达性语音转换的论文。G(x,Ey,cy)中附加的Ey鼓励G(x,Ey,cy)携带依赖说话者的情绪风格信息,使C更容易对G(x,Ey,cy)在目标域具有较高的准确率。我们得到了如图4(a).所示的64维情绪风格特征然后,我们使用一个全连接的层,将情感风格的特征与36维的mcep合并在一起,然后将其用作生成器的输入。

2023-08-07 23:19:03 138

翻译 音色转换论文粗翻||TOWARD DEGRADATION-ROBUST VOICE CONVERSION走向降级-稳健的语音转换

ABSTRACT任意到任意的语音转换技术可以将一个话语的音色转换为任何说话者,即使在训练过程中也看不见。虽然已经有了几个最先进的任意到任意的语音转换模型,但它们都是基于干净的话语来转换成功的。然而,在现实世界中,很难收集到说话者的干净话语,而且它们通常会因噪音或混响而退化。因此,我们非常希望理解这些退化如何影响语音转换,并建立一个退化健壮的模型。我们在本文中报告了第一个对任意语音转换的退化鲁棒性的全面研究。我们表明,目前最先进的模型的性能受到了严重的阻碍。

2023-08-07 22:43:17 143

翻译 音色转换论文粗翻译||A COMPARISON OF DISCRETE AND SOFT SPEECH UNITSFOR IMPROVED VOICE CONVERSION

我们还将我们的语音转换系统与两种常见的基线进行了比较: AutoVC5 [8]和来自语音转换挑战2020 [9]的级联ASR-TTS6系统[6]。总之,离散的内容编码器将一个输入的话语映射到一系列离散的语音单元h d1,……式中,i为第i个离散单元的聚类指数,ei为相应的可训练嵌入向量,sim(·,·)计算软单元和离散单元之间的余弦相似度,τ为温度参数…然后,一个线性层投射输出,以产生一系列的软语音单元h s1,。通过对离散单元分配中的不确定性进行建模,我们的目标是保留更多的内容信息,从而纠正错误的发音。

2023-08-07 21:48:56 158

翻译 SIG-VC: A SPEAKER INFORMATION GUIDED ZERO-SHOT VOICE CONVERSIONSYSTEM FOR BOTH HUMAN BEINGS AND MAC

我们对说话者的嵌入进行了客观的评估,作为一个额外的指标,以评估两个话语是否属于同一话语话者我们计算了我们提出的系统和预测的说话者嵌入之间的余弦相似度。由于两个说话者信息操纵者的参数是共享的,所以PreNet1基本上表示说话人信息的删除,而PreNet2表示说话人信息的添加。我们还计算三对发言人嵌入的余弦相似度在图5中,预测嵌入之间的相似性分数嵌入和平均目标嵌入,嵌入之间的嵌入相同的话语和平均嵌入的发言人,和不同的话语的嵌入和另一个不同的说话者的平均嵌入。设ˆX表示SI加法器的输出,X表示给定的mel谱图。

2023-08-07 21:20:24 93

翻译 AC-VC: NON-PARALLEL LOW LATENCY PHONETIC POSTERIORGRAMS BASEDVOICE CONVERSION AC-VC:基于非并行低延时语音后处理的语音

AC-VC:基于非并行低延时语音后处理的语音转换。

2023-08-07 17:19:03 54

翻译 粗翻译||End-to-End Voice Conversion with Information Perturbation

语音转换的理想目标是将源说话者的语音转换为类似于目标说话者的自然声音,同时保持语言内容和源语音的韵律。然而,目前的方法不足以在转换后的语音中实现全面的源韵律传输和目标说话人音色保存,由于声学模型与声码器的不匹配,转换后的语音的质量也不令人满意。在本文中,我们利用信息扰动的最新进展,提出了一种完全的端到端的方法来进行高质量的语音转换。我们首先采用信息扰动来去除源语音中与说话人相关的信息,以解开说话人的音色和语言内容,然后通过内容编码器对语言信息进行建模。

2023-08-07 16:19:01 52

翻译 在非并行语音转换中传输源样式Transferring Source Style in Non-Parallel Voice Conversion

本研究提出了一种基于序列到序列的非并行VC方法,该方法能够通过显式建模将语音风格从源语音转换到转换语音。客观评价和主观听力测试表明,所提出的VC方法在语音自然性和说话人相似性方面具有优越性。实验结果还表明了该方法的源式可转移性

2023-08-07 15:06:05 54

翻译 Towards Low-Resource StarGAN Voice Conversion using Weight Adaptive Instance Norm向低资源的权重自适应语音转换实例规范化

Many-to-many voice conversion with non-parallel training data hasseen significant progress in recent years. It is challenging becauseof lacking of ground truth parallel data. StarGAN-based modelshave gained attentions because of their efficiency and eff

2023-08-02 16:15:57 70

原创 如何写论文引言部分

😂等我玩够了再说吧。

2023-07-20 10:27:56 54

原创 批量pdf转换为word

file_path=r'文件绝对路径'

2023-07-14 21:39:37 224

原创 语音文件分析

语音文件分析

2023-01-08 19:00:22 777

转载 CodeEditPro2.1基础使用——打开文件,查看波形图及语谱图

声音可视化

2023-01-08 18:44:24 440

原创 声音产生感知简记

人的发音器官包括:肺、气管、声带、喉、咽、鼻腔、口腔、唇。肺部产生的气流冲击声带,产生震动。

2023-01-08 17:46:20 598

原创 智能语音标注工具小记

做深度学习语音智能处理方面所需要的标注工具

2023-01-08 16:46:17 1194

原创 声学特征提取普及笔记

声学特征预处理:预加重、分帧、加窗;声学特征提取:STFT、FBank、语谱图、MFCC声音信号分离

2023-01-08 12:33:10 996

原创 P8第一讲(选修):反向传播Backpropagation

backpropagation(反向传播)可以帮助我们有效的进行渐变迭代计算(帮助计算梯度)。

2023-01-05 19:47:26 274

原创 P7选修 深度学习介绍

神经网络是一个函数神经网络中的矩阵运算手写体识别例子

2023-01-05 17:12:10 451 1

原创 p2深度学习基本概念简介下笔记

李宏毅教授深度学习基本概念简介下

2023-01-04 21:17:19 354

原创 p2机器学习基本概念简介

ML的总体来说就是Looking for Function,每个Function可以实现特定的任务,而特定的任务大致可以分为三类:回归 ,输出是一个数值;分类 ,给定选项(classes),Function给出correct one;结构学习 ,生成或者创造特定结构的内容;

2023-01-04 17:43:39 450

原创 给定一个列表和一个整数,设计算法找到两个数的下标,使得两个数之和为给定的整数。保证肯定仅有一个结果。

查找排序算法题

2022-12-14 13:40:20 398

原创 查找排序算法-给两个字符串s和t,判断t是否为s的重新排列后组成的单词

给两个字符串s和t,判断t是否为s的重新排列后组成的单词

2022-12-13 21:41:59 160

原创 基数排序实现详细注释版python

基数排序详细注释Python

2022-12-13 21:08:14 76

原创 基数排序python

基数排序python

2022-12-13 20:31:01 1074

原创 桶排序实现及性能

桶排序及性能

2022-12-13 12:46:26 79

原创 计数排序---计数排序算法实现及性能分析

计数排序算法实现及性能分析

2022-12-12 22:03:25 133

原创 归并排序与归并排序的使用及归并排序与快速排序、堆排序运行时间比较

NB三排序

2022-12-12 17:49:34 538

原创 c语言基础进阶复习

c++学习

2022-11-14 23:12:21 457

翻译 用于说话人验证的多查询多头注意力池和 Inter-TOPK 惩罚

在一些混淆的说话者上增加额外的类间topK惩罚。通过采用MQMHA和inter-topK惩罚

2022-11-14 22:57:01 297

原创 【无标题】无聊的代码

vars='uid=236&type=ab&kw=hh'res=vars.split('&')# print(res)for i in res: r=i.split('=') print(r) # print(r.pop())# print(res)#魔方阵n =5# 5*5二维列表magic_square = [[0 for x in range(n)] for y in range(n)]i = n /.

2021-12-18 10:27:34 488

原创 创建第一个Django第一项目

修改:Performing system checks...System check identified no issues (0 silenced).You have 18 unapplied migration(s). Your project may not work properly until you apply the migrations for app(s): admin, auth, contenttypes, sessions.Run 'python ...

2021-08-08 23:58:15 195

原创 Pycharm中 安装 Django

创建应用使用命令行模式创建应用在 Terminal 中输入python manage.py startappapp01(应用名):【Django在Terminal中python manage.py startapp 应用名报name 'os' is not defined解决办法:打开settings文件,加上import os】此时新建了一个app01文件app01应用文件中包含:admin.py :管理站点模型的声明文件,默认为空。apps...

2021-08-08 22:56:02 1172

原创 生成器和迭代器python

=生成器如何读取大文件:def readmylines(f,mewline): buf = "" while True: while newline in buf: pos = buf.index(newline)#找到字符的位置 yield buf[:pos] ...

2021-08-08 17:38:35 82

原创 第八章 元类编程复习

proterty动态属性property 作用和应用场景:@property 优化了属性读取和设置的可读性 需要限制属性的特征; 只读属性。如果属性只可以读,不可以写,用起来很方便。 这个属性根据一个变化的环境动态改变。 举例https://www.cnblogs.com/wagyuze/p/10622561.htmlfrom datetime import datetime, dateclass User: def __ini...

2021-08-08 16:38:52 82

原创 Python属性描述符对象

实例中的属性,类中的属性动态的创建类通过函数type创建类:bases基类 dict属性无type时候元类创建方法描述符是什么:描述符本质就是一个新式类,在这个新式类中,至少实现了__get__(),__set__(),__delete__()中的一个,这也被称为描述符协议__get__():调用一个属性时,触发__set__():为一个属性赋值时,...

2021-08-08 15:44:30 145

原创 魔法函数__getattr__(有条件执行)和 __getattribute__(无条件执行)区别

#__getarr__,__getattribute__#__getattr__就是在查找不到属性的时候调用from datetime import dateclass User: def ___init__(self,name,brithday,info={}): self.name=name self.brithday=brithday self.info=info def __getattr__(self, item): ...

2021-08-08 13:58:14 149

原创 追求美好!我用python~~~~

#不建议继承List和dictclass Mydict(dict): def __setitem__(self, key, value): super().__setitem__(key,value*2)my_dict=Mydict(one=1)print(my_dict)my_dict['two']=1print(my_dict)'''结果:{'one': 1}{'one': 1, 'two': 2}'''from collections import Us.

2021-08-07 15:36:56 63

编程C++基础资源学习

C++是在C语言的基础上开发的一种通用编程语言,C++理论上说可以做任何开发, 只要有合适的硬件驱动和API,特点是效率高,基本上是编译语言里面效率最高的。C++可以用来游戏开发, 大规模, 高性能, 分布式要求的程序开发等。C++ 的应用领域目前有三大类,第一类就是我们目前见到的各种桌面应用软件,尤其 Windows 桌面软件,如 QQ、安全类杀毒类软件、各种浏览器等。另外就是一些基础软件和高级语言的运行时环境,如大型数据库软件、Java 虚拟机、C# 的 CLR、Python 编译器和运行时环境等。第三类就是一些业务型应用软件的后台,像游戏的服务器后台,如魔兽世界的服务器和一些企业内部的应用系统。 c++语言在近年来深度学习算法性能提高方面也有着重要的作用,本资源将所有C++基础知识全面提纲式总结,供读者自学或者参考学习。本资源可以作为期末考试或者考研学子的参考资料,也可以作为求职者笔试面试应聘的复习资料(应届生尤其注意,一些大型国企招聘c++开发岗位多于其他岗位)。

2022-11-14

苏小妍java面试题.pdf

JAVA面试题回忆,苏小妍.,2020春招面试的所有题目,仅供后续冲刺者参考。以框架为主,基础知识为辅。

2020-04-25

循环神经网络

lstm网络 双向blstm 双向RNN 网络训练 解码 实验结果分析

2018-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除