Acoustic research_acoustic research 刷机包-CSDN博客

本文链接：https://blog.csdn.net/zhaomengszu/article/details/54562113

最近又重温了SymDetector: Detecting Sound-Related Respiratory Symptoms Using Smartphones的文章，这篇文章写的很好，很详细，很多知识都在声学的研究中有所涉及，今天重温，顺便总结一下。

关于搞声学研究的一般步骤：

Sampler：获取原始声音信号，进行分帧，加窗。

为什么分帧？

语音信号因为是准稳态信号，在处理时常把信号分帧，每帧长度约20ms-30ms，在这一区间内把语音信号看作为稳态信号。只有稳态的信息才能进行信号处理，所以要先分帧。 “语音信号分帧进行小波变换”，就是把语音信号分帧后，对每一帧进行小波变换和处理。在语音工具箱中有分帧的函数，例enframe，如果要自行分的话，可这样进行：设语音信号x，长为N，分成每帧长L，每两帧之间重叠M，则有共可分成K帧，S是分帧后的数据。

为什么加窗？

1、一个分帧里，一般不能提取有用的特征，常把几个连续的帧放在一个组里，这就成了一个window，正常情况下我们是把一个window当做是信号处理的一个单元。

2、加窗之后，原本没有周期性的语音信号呈现出周期函数的部分特征。

3、使全局更加连续，避免出现吉布斯效应。

为什么窗之间要overlap？

我们处理的时候，会出现这样的一种case。一个你要检测的事件一半发生在前一个窗口，一半发生在后一个窗口，这样如果按照一个window来进行处理的话，就会提取不了完整的特征，正常情况下，让相邻的两个窗口进行一定的重叠，本文设置为1s.具体问题具体分析。

4、提取时域的三个特征，来filter不是症状的窗口，也就是，利用时域的特征先过滤掉与，我们目的不想要的部分。过滤掉连续的事件等。

5、然后提取时域和频域的一些特征，利用这些进行一个粗分类。最后得到除了other外的两大类。

   
   
    
    

   
   
   
   
    
    6、然后选择SVM或者别的machine learning的方法，进行分类。