Acoustic research

最近又重温了SymDetector: Detecting Sound-Related Respiratory  Symptoms Using Smartphones的文章,这篇文章写的很好,很详细,很多知识都在声学的研究中有所涉及,今天重温,顺便总结一下。
关于搞声学研究的一般步骤:

 Sampler:获取原始声音信号,进行分帧,加窗。
为什么分帧?
语音信号因为是准稳态信号,在处理时常把信号分帧,每帧长度约20ms-30ms,在这一区间内把语音信号看作为稳态信号。只有稳态的信息才能进行信号处理,所以要先分帧。 “语音信号分帧进行小波变换”,就是把语音信号分帧后,对每一帧进行小波变换和处理。在语音工具箱中有分帧的函数,例enframe,如果要自行分的话,可这样进行:设语音信号x,长为N,分成每帧长L,每两帧之间重叠M,则有共可分成K帧,S是分帧后的数据。
为什么加窗?
1、一个分帧里,一般不能提取有用的特征,常把几个连续的帧放在一个组里,这就成了一个window,正常情况下我们是把一个window当做是信号处理的一个单元。
2、加窗之后,原本没有周期性的语音信号呈现出周期函数的部分特征。
3、使全局更加连续,避免出现吉布斯效应。
为什么窗之间要overlap?
我们处理的时候,会出现这样的一种case。一个你要检测的事件一半发生在前一个窗口,一半发生在后一个窗口,这样如果按照一个window来进行处理的话,就会提取不了完整的特征,正常情况下,让相邻的两个窗口进行一定的重叠,本文设置为1s.具体问题具体分析。
4、提取时域的三个特征,来filter不是症状的窗口,也就是,利用时域的特征先过滤掉与,我们目的不想要的部分。过滤掉连续的事件等。
5、然后提取时域和频域的一些特征,利用这些进行一个粗分类。最后得到除了other外的两大类。
   
   
6、然后选择SVM或者别的machine learning的方法,进行分类。
 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值