排序:
默认
按更新时间
按访问量

语音合成系统WORLD-原理和简单使用

最近在做语音合成相关的一个东西,其中后期需要做一个声音转换系统,但是真正的声音转换系统还挺复杂,因为我们的目的是希望能够将一个声音完全地变为另一个已知的 WORLD通过获取三个语音信号相关的参数信息来合成原始语音,这三个参数信息分别是:基频F0、频谱包络、非周期信号参数(英文分别为:Fu...

2018-09-25 11:25:15

阅读数:27

评论数:0

语音合成综述

title: 语音合成综述 tags: 新建,模板,小书匠 grammar_cjkRuby: true 语音相关基础知识点: 时域信号:一维原始信号 傅里叶变换:得到频域特征 短时傅里叶变换:傅里叶变换得到了频域信号,但是丢失了时域信号,所欲通过STFT得到时频信号 梅尔...

2018-09-25 10:01:04

阅读数:69

评论数:0

基于深度循环神经网络的单通道人声与音乐的分离-论文翻译

SINGING-VOICE SEPARATION FROM MONAURAL RECORDINGS USING DEEP RECURRENT NEURAL NETWORKS 主体内容:作为当前的一大热门,语音识别在得到快速应用的同时,也要更适应不同场景的需求,特别是对于智能手机而言,由于元...

2018-05-08 11:14:38

阅读数:289

评论数:0

梅尔倒谱系数实现-MFCC

""" @author: zoutai @file: mymfcc.py @time: 2018/03/26 @description: """ from matplotlib.col...

2018-03-27 12:23:59

阅读数:319

评论数:0

语音信号处理-梅尔倒频谱系数MFCC

一句话概括:将时域的语音变为频域的,对频域的信号进行分段滤波,得出不同频率段的占比(比如如果分为26段),所得到的占比系数组成的矩阵就是梅尔倒频谱系数MFCC 作用 人之所以能够通过人生辨别说话人的身份,是因为每个人的声道不同,而这个声道就相当于产生声音的器物。我们需要提出一个数据表示...

2018-03-26 17:00:43

阅读数:278

评论数:1

数字图像处理中不同的低通滤波器的区别以及cut-off frequency 对于图像的影响

最近做课设的时候遇到了低通滤波器的问题。翻阅了下书籍,得到了一些收获,想来分享下。如有不对的地方,请大神斧正。 首先要清楚的概念是,图像(假设是灰度图,便于描述,或者是单个channel的图)在时域和频域中的分别是什么含义。在时域中,很显然,对应的是每个像素,每个像素上的点的灰度值。 如果该图像用...

2017-04-04 22:34:41

阅读数:656

评论数:0

图像分割技术

图像分割技术 图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。1998年以来,研究人员不断改进原有的图像...

2016-12-04 22:37:13

阅读数:2546

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭