语音信号处理
binqiang2wang
这个作者很懒,什么都没留下…
展开
-
Deep Voice 论文
创新点 Deep Voice 将深度学习应用于语音合成的全过程。 需要提取的特征非常少,因此容易应用于不同的数据集。 与现有技术相比,这个系统非常高效,专为生产系统而设计。 流程 将语素(文本)转换为音素 预测持续时间和基频 音频合成 上面是最大概的东西,除了第一步中有查字典的过程之外,剩下两步都是靠数据(数据大佬。。。)来训练神经网络(不清楚是不是用全连接层),传统的pyth原创 2018-01-29 00:19:06 · 943 阅读 · 0 评论 -
MFCC python plot
#!/usr/bin/env python import os from python_speech_features import mfcc from python_speech_features import delta from python_speech_features import logfbank import scipy.io.wavfile as wav import pickl...原创 2018-06-20 11:33:29 · 3538 阅读 · 1 评论 -
Windows和Linux下播放采集音频文件资料汇总
写在最前面:一定要检测电脑有麦克风!!!! 首先给出一个整体的概念,在windows和Linux下录音从驱动到方法都是不一样的,所以上来推荐第一篇总体介绍的:Windows和Linux下播放采集wave格式音频文件的简单记录 如果使用ffmpeg,相关的资料可以查看FFMPEG学习(一)—【命令行】采集视频和音频。如果不考虑外部录音,只是实现一个录屏或者录电脑自身的功能,可以参考ffmpeg命令录...转载 2019-01-03 17:11:32 · 518 阅读 · 0 评论