文章目录
前言
- 在做talking face generarion时,需要对声音进行处理,还需要使得声音与视频进行对齐,这需要提取声音的MFCC特征以及选择相应的信号处理窗想汉明窗之类,但是对这方面完全不了解,现在来从头学习一下。
正文
信号的分类
-
时域连续信号
像声音信号
-
时域离散信号
自变量取离散值,函数值取连续值,通常来源于对模拟信号的采样
-
数字信号
信号的自变量和函数值均取离散值
时域离散信号
主要研究的是时域离散信号的相关知识
序列的定义
序列表示
- 这里的n代表的是第几次采样
常见序列
注意是N-1,PPT上有错误
原来的
Ω
\Omega
Ω是数字1, 2,
ω
\omega
ω单位是rad,是
Ω
\Omega
Ω与T的乘积
ω \omega ω带 π \pi π就是周期序列,对应着采样的周期与 Ω \Omega Ω的乘积带 π \pi π
用单位脉冲序列表示任意序列
序列的基本运算
序列的翻转
序列的差分
时间尺度变换
- 抽取序列可以看成是对x(n)的再次抽样
- 插值后会形成一个新序列
序列的能量
时域离散系统
线性时不变系统与输入输出的关系
序列的卷积和
- 上图是n为2也就是 y ( 2 ) y_{(2)} y(2)的示意图