![](https://img-blog.csdnimg.cn/2019092715111047.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
语音伪造
文章平均质量分 94
语音合成+语音转换
FallenDarkStar
怀着狂妄理想不自量力地前进着
展开
-
【论文学习】《Source Mixing and Separation Robust Audio Steganography》
音频隐写技术是通过在载体上进行不易察觉的修改,将秘密信息隐藏在载体音频中。虽然以前的工作解决了隐藏消息恢复对传输过程中引入的失真的鲁棒性,但他们没有解决对侵略性编辑(如混合其他音频源和源分离)的鲁棒性。在这项工作中,我们首次提出了一种隐写方法,可以将信息嵌入到混合的单个声源中,如音乐中的乐器音轨。为此,我们提出了一个时域模型和课程学习,以学习从分离源解码隐藏信息。实验结果表明,该方法成功地将信息隐藏在难以察觉的扰动中,并且通过源分离算法,即使混合了其他源和分离,也能正确地恢复信息。...原创 2022-07-20 14:00:43 · 1228 阅读 · 2 评论 -
【论文学习】《VQMIVC》
《VQMIVC: Vector Quantization and Mutual Information-Based Unsupervised Speech Representation Disentanglement for One-shot Voice Conversion》论文学习文章目录《VQMIVC: Vector Quantization and Mutual Information-Based Unsupervised Speech Representation Disentanglement原创 2022-05-30 20:56:46 · 1235 阅读 · 0 评论 -
【论文学习】《Practical Attacks on Voice Spoofing Countermeasures》
我们开发了第一个针对CMs的实际攻击,并展示了恶意行为者如何高效地制作音频样本,以绕过最严格形式的语音认证。以前的工作主要集中在非主动攻击或对抗策略的ASV,而不是使用受害者的音色生成语音。我们攻击的后果要严重得多,因为我们生成的样本听起来像受害者,消除了受害者任何貌似合理的推脱机会。原创 2022-03-23 22:35:08 · 3850 阅读 · 0 评论 -
【论文学习】《One-shot Voice Conversion by Separating Speaker and Content Representations with IN》
近年来,在没有并行数据的情况下,通过训练单个模型在输入语音转换(VC)为多个不同说话人的多目标场景下,成功实现了语音转换。但该模型存在局限性,只能将训练数据中说话人进行语音转换,从而缩小了VC的适用场景。在本文中,我们提出了一种新颖的一次性VC方法,它可以分别通过源说话人和目标说话人的一个示例语音来执行VC,并且在训练过程中源说话人和目标说话人甚至不需要出现。这是通过将说话人和内容表示与实例规范化(IN)分开来实现的。客观和主观评价表明,我们的模型能够生成与目标说话人相似的声音。原创 2022-02-26 19:01:30 · 2430 阅读 · 0 评论 -
【论文学习】《Tacotron: Towards End-to-End Speech Synthesis》
《Tacotron: Towards End-to-End Speech Synthesis》论文学习文章目录《Tacotron: Towards End-to-End Speech Synthesis》论文学习 摘要 1 介绍 2 相关工作 3 模型架构 3.1 CBHG模块 3.2 编码器 3.3 解码器 3.4 后处理网和波形合成 4 模原创 2022-01-23 12:19:18 · 3868 阅读 · 0 评论 -
【论文学习】《“Hello, It’s Me”: Deep Learning-based Speech Synthesis Attacks in the Real World》
《“Hello, It’s Me”: Deep Learning-based Speech Synthesis Attacks in the Real World》论文学习文章目录《“Hello, It’s Me”: Deep Learning-based Speech Synthesis Attacks in the Real World》论文学习 摘要 1 介绍 2 背景 2.1 基于语音的用户标识 2.2 语音合原创 2021-11-23 19:39:46 · 4056 阅读 · 0 评论 -
【论文学习】《A Overview of Spoof Speech Detection for Automatic Speaker Verification》
《A Overview of Spoof Speech Detection for Automatic Speaker Verification》论文学习文章目录《A Overview of Spoof Speech Detection for Automatic Speaker Verification》论文学习 摘要 1 介绍 2 ASV 系统:欺骗攻击 2.1 双胞胎 2.2 模仿 2.原创 2021-10-16 13:47:11 · 2985 阅读 · 0 评论 -
【论文学习】《MOSNet: Deep Learning-based Objective Assessment for Voice Conversion》
《MOSNet: Deep Learning-based Objective Assessment for Voice Conversion》论文学习文章目录《MOSNet: Deep Learning-based Objective Assessment for Voice Conversion》论文学习 摘要 1 介绍 2 语音转换挑战评估数据 2.1 2018 年语音转换挑战 2.2 数据及其分布和可预测性&nb原创 2021-09-27 20:23:40 · 2164 阅读 · 0 评论 -
【论文学习】《FastPitch: Parallel Text-to-speech with Pitch Prediction》
《FastPitch: Parallel Text-to-speech with Pitch Prediction》论文学习文章目录《FastPitch: Parallel Text-to-speech with Pitch Prediction》论文学习 摘要 1 介绍 2 模型描述 2.1 输入符号持续时间 2.2 输入符号的音高 3 实验 3.1 设置  原创 2021-08-18 21:40:21 · 1320 阅读 · 3 评论 -
【论文学习】《Neural Speech Synthesis with Transformer Network》
《Neural Speech Synthesis with Transformer Network》论文学习文章目录《Neural Speech Synthesis with Transformer Network》论文学习 摘要 1 介绍 2 背景 2.1 序列到序列模型 2.2 Tacotron2 2.3 Transformer for NMT 3 使用 Transfor原创 2021-08-12 17:39:11 · 993 阅读 · 0 评论 -
【论文学习】《Parallel WaveGAN: A fast waveform generation model based on generative adversarial networks》
《Parallel WaveGAN : A fast waveform generation model based on generative adversarial networks with Multi-Resolution Spectrogram》论文学习文章目录《Parallel WaveGAN : A fast waveform generation model based on generative adversarial networks with Multi-Resolution S原创 2021-08-06 17:08:15 · 1060 阅读 · 3 评论 -
【论文学习】《On Prosody Modeling For ASR+TTS Based Voice Conversion》
《On Prosody Modeling For ASR+TTS Based Voice Conversion》论文学习文章目录《On Prosody Modeling For ASR+TTS Based Voice Conversion》论文学习 摘要 1 介绍 2 基于 ASR + TTS 的语音转换 2.1 整体框架和转换过程 2.2 中间表示 2.3 训练 3 基于 ASR原创 2021-08-03 15:09:56 · 949 阅读 · 0 评论 -
【论文学习】《Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis》
《Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis》论文学习文章目录《Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis》论文学习 摘要 1 介绍 2 多说话人语音合成模型 2.1 说话人编码器 &原创 2021-07-24 13:36:43 · 939 阅读 · 1 评论 -
【论文学习】《FastSpeech 2: Fast and High-Quality End-to-End Text-to-Speech》
《FastSpeech 2: Fast and High-Quality End-to-End Text-to-Speech》论文学习文章目录《FastSpeech 2: Fast and High-Quality End-to-End Text-to-Speech》论文学习 摘要 1 介绍 2 方法 2.1 动机 2.2 模型概述 2.3 方差适配器 2.4 Fa原创 2021-07-20 18:56:36 · 2313 阅读 · 3 评论 -
【论文学习】《A Survey on Neural Speech Synthesis》
《A Survey on Neural Speech Synthesis》论文学习文章目录《A Survey on Neural Speech Synthesis》论文学习 摘要 1 介绍 1.1 TTS 技术的历史 1.2 调查的组成 2 TTS 中的关键组件 2.1 主要分类 2.2 文本分析 2.3 文本分析原创 2021-07-19 22:35:40 · 5035 阅读 · 2 评论 -
【论文学习】《FastSpeech: Fast, Robust and Controllable Text to Speech》
《FastSpeech: Fast, Robust and Controllable Text to Speech》论文学习文章目录《FastSpeech: Fast, Robust and Controllable Text to Speech》论文学习 摘要 1 介绍 2 背景 3 FastSpeech 3.1 前馈 Transformer 3.2 长度调节器 3.3 持续时间原创 2021-06-27 12:10:26 · 1771 阅读 · 1 评论 -
【论文学习笔记】《WaveGlow : A Flow-Based Generative Network For Speech Synthesis》
《WaveGlow : A Flow-Based Generative Network For Speech Synthesis》论文学习文章目录《WaveGlow : A Flow-Based Generative Network For Speech Synthesis》论文学习 摘要 1 介绍 2 WaveGlow 2.1 仿射耦合层 2.2 1x1可逆的卷积 2.3 早期输出 原创 2021-04-08 12:31:54 · 1275 阅读 · 0 评论 -
【论文学习笔记】《StarGAN-VC: Non-Parallel M2M Voice Conversion With Star Generative Adversarial Networks》
《StarGAN-VC: Non-Parallel Many-To-Many Voice Conversion With Star Generative Adversarial Networks》论文学习文章目录《StarGAN-VC: Non-Parallel Many-To-Many Voice Conversion With Star Generative Adversarial Networks》论文学习 摘要 1 介绍 2 CYCLEGAN 声音转换&nbs原创 2021-03-23 19:42:51 · 1617 阅读 · 2 评论 -
【论文学习笔记】《Voice Conversion from Non-parallel Corpora Using Variational Auto-encoder》
《Voice Conversion from Non-parallel Corpora Using Variational Auto-encoder》论文学习文章目录《Voice Conversion from Non-parallel Corpora Using Variational Auto-encoder》论文学习 摘要 1 介绍 2 提出的方法 2.1 从未对齐的数据为 SC 重新制定自动编码器 2.2 架构原创 2021-03-16 17:55:28 · 505 阅读 · 0 评论 -
【论文学习笔记】《Voice Transformer Network》
《Voice Transformer Network: Sequence-to-Sequence Voice Conversion Using Transformer with Text-to-Speech Pretraining》论文学习文章目录《Voice Transformer Network: Sequence-to-Sequence Voice Conversion Using Transformer with Text-to-Speech Pretraining》论文学习 摘要&n原创 2021-03-14 12:24:10 · 666 阅读 · 0 评论 -
【论文学习笔记】《DEEP VOICE 3: SCALING TEXT-TO-SPEECH WITH CONVOLUTIONAL SEQUENCE LEARNING》
《DEEP VOICE 3: SCALING TEXT-TO-SPEECH WITH CONVOLUTIONAL SEQUENCE LEARNING》论文学习文章目录《DEEP VOICE 3: SCALING TEXT-TO-SPEECH WITH CONVOLUTIONAL SEQUENCE LEARNING》论文学习 摘要 1 介绍 2 相关工作 3 模型架构 3.1 文本预处理 3.2 字符和音素的原创 2021-03-08 12:26:34 · 990 阅读 · 0 评论 -
【论文学习笔记】《NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS》
《NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS》论文学习文章目录《NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS》论文学习 摘要 1 介绍 2 模型架构 2.1 中间特性表征 2.2 光谱图预测网络 原创 2021-03-05 12:46:47 · 821 阅读 · 1 评论 -
【论文学习笔记】《Phonetic Posteriorgrams For Many-To-One Voice Conversion Without Parallel Data Training》
《Phonetic Posteriorgrams For Many-To-One Voice Conversion Without Parallel Data Training》论文学习文章目录《Phonetic Posteriorgrams For Many-To-One Voice Conversion Without Parallel Data Training》论文学习 摘要 1 介绍 2 基线:基于 DBLSTM 的方法,并行训练数据原创 2021-03-02 16:45:26 · 1309 阅读 · 2 评论 -
【论文学习笔记】《AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss》
《AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss》论文学习文章目录《AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss》论文学习 摘要 1 介绍 2 相关工作 3 风格转移自动编码器 3.1 问题描述 3.2 自动编码器框架 &nbs原创 2021-03-01 01:24:13 · 2601 阅读 · 0 评论 -
【论文学习笔记】《Cotatron》
《Cotatron: Transcription-Guided Speech Encoder for Any-to-Many Voice Conversion without Parallel Data》论文学习 摘要 我们提出 Cotatron ,一种转录引导的语音编码器,用于独立于说话人的语言表示。 Cotatron 基于多说话人 TTS 体系结构,可以用传统的 TTS 数据集进行原创 2021-02-19 11:09:03 · 750 阅读 · 0 评论 -
【论文学习笔记】《An Overview of Voice Conversion and Its Challenges》
《An Overview of Voice Conversion and Its Challenges: From Statistical Modeling to Deep Learning》论文学习文章目录《An Overview of Voice Conversion and Its Challenges: From Statistical Modeling to Deep Learning》论文学习 摘要 1 介绍 2 典型语音转换流程 3 使用并行训原创 2021-02-10 22:41:24 · 2370 阅读 · 0 评论 -
【论文学习笔记】《Deep Voice 2: Multi-Speaker Neural Text-to-Speech》
Deep Voice 2 论文学习文章目录Deep Voice 2 论文学习 摘要 1 介绍 2 相关工作 3 单说话人 Deep Voice 2 4 带有可训练说话人嵌入的多说话人模型 5 结果 6 结论 摘要 本文介绍了一种利用低维可训练扬声器嵌入增强神经文本到语音 的技术,以从单个模型产生不同的声音。 &nb原创 2021-02-05 23:29:36 · 898 阅读 · 0 评论 -
【论文学习笔记】《Tacotron: Towards End-To-End Speech Synthesis》
Tacotron 论文学习文章目录Tacotron 论文学习 1 简介 2 相关工作 3 模型架构 3.1 CBHG模块 3.2 编码器 3.3 解码器 3.4 后置处理网络与波形合成 4 模型细节 5 实验 5.1 烧蚀分析 5.2 平均意见得分测验 6 讨论 1原创 2021-01-30 15:36:56 · 507 阅读 · 2 评论 -
【论文学习笔记】《Deep Voice: Real-time Neural Text-to-Speech》
Deep Voice 1 论文学习文章目录Deep Voice 1 论文学习 1 简介 2 相关研究 3 TTS 系统组件 3.1 字素到音素模型 3.2 分隔模型 3.3 音素持续时间模型与基频模型 3.4 音频合成模型 4 结果 4.1 分割结果 4.2 字素到音素结果 4.原创 2021-01-24 22:40:58 · 1128 阅读 · 0 评论 -
【论文学习笔记】《Parallel WaveNet: Fast High-Fidelity Speech Synthesis》
Parallel WaveNet 论文学习 1 简介 WaveNet 架构是当前语音合成领域中最先进的技术之一。在不同语言下,它合成的声音更为自然。然而,由于 WaveNet 在同一时间只能有序生成一个音频样本,因此难以真正运用到生产环境中。 Parallel WaveNet 这篇论文介绍了一种新的方法:概率密度蒸馏。这种方法可原创 2021-01-19 22:46:47 · 1117 阅读 · 0 评论 -
【论文学习笔记】《A Review of Deep Learning Based Speech Synthesis》
基于深度学习的语音合成综述论文学习文章目录基于深度学习的语音合成综述论文学习 1 简介 2 语音合成概述 2.1 语音合成概念 2.2 语音合成发展历史 2.3 传统语音合成技术 2.3.1 拼接式语音合成 2.3.2 参数式语音合成 3 基于统计参数的语音合成技术 3.1 文本分析模块&原创 2021-01-15 23:15:53 · 877 阅读 · 0 评论 -
【论文学习笔记】《WaveNet: A generative model for raw audio》
WaveNet论文简介文章目录WaveNet论文简介 摘要 应用方向 模型结构 1.WaveNet运用了因果卷积与扩大卷积。 2.SOFTMAX分布 3.门控激活单元 &nbs原创 2021-01-13 23:38:10 · 1981 阅读 · 2 评论