语音/图像处理
随风而醒
我是个疯子,虽然我在服新药,但仍旧有幻觉
展开
-
图像分割技术
图像分割技术图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。1998年以来,研究人员不断改进原有的图像分割方法并把其它学科的一些新理论和新方法用于图像分割,提出了不少新的分割方法。图像分割后提取出的目标原创 2016-12-04 22:37:13 · 4714 阅读 · 0 评论 -
数字图像处理中不同的低通滤波器的区别以及cut-off frequency 对于图像的影响
最近做课设的时候遇到了低通滤波器的问题。翻阅了下书籍,得到了一些收获,想来分享下。如有不对的地方,请大神斧正。首先要清楚的概念是,图像(假设是灰度图,便于描述,或者是单个channel的图)在时域和频域中的分别是什么含义。在时域中,很显然,对应的是每个像素,每个像素上的点的灰度值。 如果该图像用matlab显示的话,(x,y)代表图中的每个像素,每个像素对应Z的值就是该图像在这个像素点的灰度。转载 2017-04-04 22:34:41 · 3024 阅读 · 0 评论 -
语音信号处理-梅尔倒频谱系数MFCC
一句话概括:将时域的语音变为频域的,对频域的信号进行分段滤波,得出不同频率段的占比(比如如果分为26段),所得到的占比系数组成的矩阵就是梅尔倒频谱系数MFCC作用人之所以能够通过人生辨别说话人的身份,是因为每个人的声道不同,而这个声道就相当于产生声音的器物。我们需要提出一个数据表示方式来代表每个人特定的声道,这样,我们只需要直到某个人这个特定的数据表示形式,就知道了这个语音讲话者的...原创 2018-03-26 17:00:43 · 3571 阅读 · 1 评论 -
梅尔倒谱系数实现-MFCC
""" @author: zoutai@file: mymfcc.py @time: 2018/03/26 @description:"""from matplotlib.colors import BoundaryNormimport librosaimport librosa.displayimport numpyimport scipy.io.wavfilefrom s...转载 2018-03-27 12:23:59 · 1710 阅读 · 0 评论 -
基于深度循环神经网络的单通道人声与音乐的分离-论文翻译
SINGING-VOICE SEPARATION FROM MONAURAL RECORDINGS USING DEEP RECURRENT NEURAL NETWORKS 主体内容:作为当前的一大热门,语音识别在得到快速应用的同时,也要更适应不同场景的需求,特别是对于智能手机而言,由于元器件的微型化导致对于语音处理方面的器件不可能很大,因此单通道上的语音分离技术就显得极为重要,而语音分离...翻译 2018-05-08 11:14:38 · 5161 阅读 · 4 评论 -
语音合成综述
title: 语音合成综述tags: 新建,模板,小书匠grammar_cjkRuby: true语音相关基础知识点:时域信号:一维原始信号傅里叶变换:得到频域特征短时傅里叶变换:傅里叶变换得到了频域信号,但是丢失了时域信号,所欲通过STFT得到时频信号梅尔频谱倒谱系数:单单频率信号表达不足,为了更加和人的耳朵听觉相符,我们使用了mel窗滤波,得到人耳的频率段幅度系数梅尔声谱...原创 2018-09-25 10:01:04 · 7377 阅读 · 0 评论 -
语音合成系统WORLD-原理和简单使用
最近在做语音合成相关的一个东西,其中后期需要做一个声音转换系统,但是真正的声音转换系统还挺复杂,因为我们的目的是希望能够将一个声音完全地变为另一个已知的WORLD通过获取三个语音信号相关的参数信息来合成原始语音,这三个参数信息分别是:基频F0、频谱包络、非周期信号参数(英文分别为:Fundamental Frequency、spectral envelope、aperiodic parame...原创 2018-09-25 11:25:15 · 8338 阅读 · 5 评论