音高追踪的基本流程如下:
1、将整段音讯讯号切成音框(frames),相邻音框之间可以重叠。
2、算出每个音框所对应的音高。
3、排除不稳定的音高值。(可由音量来帅选,或由音高值的范围来过滤。)
4、对整段音高进行平滑化,通常是使用“中位数滤波器”(median filters)。
由一个音框计算出音高的方法很多,可以分为时域和频域两大类。
````时域(time domain):
*ACF:Autocorrelation function
*AMDF:Average magnitude difference function
*SIFT:Simple inverse filter tracking
````频域(frequency domain):
*Harmonic product spectrum method
*Cepstrum method
一、ACF(使用自相关函数进行音高追踪)
二、AMDF
三、SIFT
连接见:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptTimeDomainSift.asp?title=7-4 SIFT
四、HPS
连接见:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptFreqDomainHps.asp?title=7-5 HPS
五、Cepstrum
连接见:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptFreqDomainHps.asp?title=7-5 HPS
六、音高解析度的提升
连接见:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptResolution.asp?title=7-7 How to Increase Pitch Resolution (音高解析度的提升)
源地址:http://bingxinye1.blog.163.com/blog/static/1687970982011820281924/