PeriodWave: Multi-Period Flow Matching for High-Fidelity Waveform Generation

  • demo page
    PeriodWave 三者最好,而且能把原声中的噪声去掉,GAN一类声码器做不到的。
    PeriodWave + FreeU (step 16) 有白噪声
    MB-PeriodWave (step 16) 有电音
  • abstract

    • PeriodWave,第一个基于周期信息用于高分辨音频生成的结构。
    • 使用生成能力强大的flow-matching,结合优化器路径进行快速采样。探讨不同的ODE对于音频生成的效果。
    • 使用多周期估计器【使用质数prime number避免重叠】可以显著提升语音质量,但是会增大计算量导致infer 变慢。本文提出一个period-conditional universal estimator ,可以在推理阶段并行的推理多个周期路径。
    • 此外,还使用DWT变换,用以建模高频低频信息。用FreeU 降低高频噪声。

    method

    在这里插入图片描述

    • 加速infer:(1)多个不同周期的估计器并行推理预测,sum,然后由final block 预测波形;(2)mel-Encoder 编码time-shared conditional 用于flow-base estimators;

    Flow Matching for Waveform Generation

    1. wav 的范围【-1,1】,因此正态分布的噪声对于优化路径是比较大的值,会导致高频信息损失;因此噪声 x 0 ∗ 0.5 x_0 * 0.5 x00.5
    2. 做了1之后还有轻微白噪声,从mel中得到一个时间相关的energy condition;

    High-frequency Information Modeling for Flow Matching

    • flow-matching 重建波形,会有高频损失;【Roman,From discrete tokens to high-fidelity audio using multi-band diffusion】,解决方法:Roman提出multi-band diffusion,每个band使用特定的降噪器,还提出frequency equlizer 通过正则每个band 噪声energy scale来减少白噪声;
    • 本文用DWT,将频带分成 [0-3, 3-6, 6-9, 9-12 kHz],首先生成低频结构,加在 x 0 x_0 x0上,生成更高的频带,这样做显著的提升了生成音质(even in small sampling steps);将mel 按照band平均,得到先验,[0-61, 60-81, 80-93, 91-100 bins]. ----- 各个band 是wav -dwt 变换之后的;infer时候,第一个band idwt 得到波形;
    • FreeU证明skip connection会包含很多高频信息,从而让模型忽视语义信息【Freeu: Free lunch in diffusion u-net.】
    • 本文实验也发现skip connection会包含很多高频信息,导致噪声。因此在skip阶段,对信息进行加权 x = α ⋅ z s k i p + β ⋅ x x=α⋅zskip +β⋅x x=αzskip+βx,增大backbone特征(x)可以改善听感质量,降低噪声。
  • 15
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
该错误表示在SSH连接中,无法匹配到适配的主机密钥类型。对于提供的主机密钥类型为ssh-rsa时发生了不匹配的情况。 为了解决这个问题,可以按照以下步骤操作: 1. 找到本地的SSH目录,通常位于C:\Users\用户名\.ssh。 2. 检查是否存在config文件,如果不存在,则创建一个config文件。 3. 在config文件中添加以下配置: Host * HostkeyAlgorithms ssh-rsa PubkeyAcceptedKeyTypes ssh-rsa 4. 保存并关闭config文件。 5. 尝试再次使用git clone命令克隆代码。 这样,你应该能够成功克隆代码了。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [.ssh目录中config配置文件](https://download.csdn.net/download/gongjin28_csdn/85413492)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [Unable to negotiate with 100.12.0.7 port 22: no matching host key type found. Their offer: ssh-rsa](https://blog.csdn.net/qiuyu1998/article/details/124726695)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [解决no matching host key type found. Their offer: ssh-rsa报错信息具体方法](https://blog.csdn.net/weixin_43636782/article/details/123416064)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值