CQCC
1. abstract
CQCC特点,时间分辨率可变
优点是能够可靠捕获模仿攻击的一些信息,并且他的结构对用例情景和模仿攻击同时敏感(以往的仿模仿的系统没有和用例情景结合)
2. Introduction
ASV面临的攻击:
- replay
- voice conversion
- speech synthesis
- impersonation
一般情况下可以通过特征提取和模式识别的作为对策,但最好是研究一种新的具有鲁棒性的特征,因此用到了CQT,来自音乐处理领域(有空可以看一看他的论文)
然后看一下FFT和CQT的时间频率分辨率的对比:
究竟为什么CQT适合做音乐处理,轨道分离?并且CQT的缺点又是什么,需要看其中的引文。
WIKI上的CQT和FFT的对比汇总:(他 = CQT)
- 他的数据量少
- 他的计算和实现比较复杂
- 他能提取乐器的特征,谐波的模式,和基频无关
- 他更符合人的听觉感官
- 可以用他来计算基频