基础知识
一弦-sring
声学专业在读博士,语音信号处理方向
展开
-
傅里叶变换(FS、FT、DTFT、DFT、DFS、FFT)、拉普拉斯变换和Z变换
傅里叶变换的目的:时域转为频域,滤波,求解微分方程等FS(Fourier Series)傅里叶级数:时域周期连续,频域离散。任何信号都可以看作是无限多的正弦波的叠加时域:基本单位是1s频域:基本单位w(基础是cos(wt))代表“1”;代表“0”的是sin(wt),是直流分量注意:频率的单位是w(或者f=w/2Π),是实数,而不是附属jw或者e^jw,幅度谱:正面看,即时域...原创 2020-03-19 13:43:31 · 23403 阅读 · 3 评论 -
听觉器官及机理
外耳耳廓、耳壳和外耳道:收集、辨别、扩大声音外耳道有许多共振频率,与语音频率范围相符外耳道长2.5—3.5cm,宽0.6—1cm中耳鼓膜和听骨链(锤骨、砧骨和镫骨):传声作用,改变增益,气体运动转换为液体运动听骨链相当于杠杆,锤骨连接鼓膜,镫骨连接耳蜗前庭窗,鼓膜:前庭窗=55:3.2内耳前庭窗:接收中耳传过来的信号圆窗:为不可压缩液体缓解压力耳蜗(鼓阶、中阶...原创 2020-02-25 13:38:28 · 778 阅读 · 1 评论 -
语音发声机理及发声线性模型
一、生理结构动力源气源:肺和气管激励源声门:喉和声带滤波器:共鸣器声道:咽喉、口腔和鼻腔成年男子的声道平均长度17cm.二、语音生成1、发声原理声门:一侧是“声门子系统”,产生激励振动;一侧是“声道系统”和“辐射系统”(1)浊音声带紧绷,气流来了后,张弛振动,周期性的开启和闭合,形成准周期性的脉冲状空气流(周期为基音周期)。声带越短、厚度越薄、张力越大...原创 2020-02-24 22:39:11 · 1601 阅读 · 0 评论 -
语音信号处理分类
人与人之间的通信:语音压缩与编码压缩语音信号的传输带宽或者降低电话信道的传输码率解释:比特率=位深X采样率X信道个数,比特率越高,还原度越高,速度越慢。所以降低编码比特率,可以节省频率资源。第一类人与机器之间的通信:语音合成机器讲话,人接听文语转换(TTS)系统,主要关注可理解度,自然度,可懂度,逼真度(情感语音合成)第二类人与机器之间的通信:语音识别人讲话,机器接...原创 2020-02-24 21:15:07 · 1507 阅读 · 0 评论