Research中采样率,bin,FFT后的理解

读paper:AirLink: Sharing Files Between Multiple Devices Using In-Air Gestures


其中一段中一些数字的理解:


AirLink requires a pilot tone continuously played through the device’s speakers. Most speakers on phones and laptops are able to generate audio up to 22 KHz. In this work we selected the pilot tone at 18.8 KHz because it is usually inaudible for human while detectable by almost all standard microphones. With this ultrasonic tone being emitted, motions near the device cause Doppler-shifted reflections,which can be picked up by the microphones.The system samples at44.1 KHz, processing the signal in segments of4096 samples (about 0.093s) at a time. For each segment, it computes the Fast Fourier Transform(FFT), yielding a2048-point FFT vector with 10.77 Hz bins.The system then removes incidental noise by setting elements in the vector with values under 2.5% of the magnitude of the pilot tone to zero. This threshold value was chosen empirically (see Figure 4 and Evaluation and Results section). The result of this process is a stream of FFT vectors,which AirLink uses to recognize gestures.


目前现在大多数的speaker能够产生的超声波多数是22KHZ,本文使用的是18.8KHZ的声波。

我们目前的研究使用microphone的采样率是44100HZ。根据我们截取的时间,我们能够很容易的算出来一帧的sample的数量,文中使用的是4096个sample,这也是比较常用的数量

我们对于 每一个的frame做FFT处理,本来4096个sample,经过FFT处理后,应该还是4096个点,但是由于经过FFT变换后,信号在频域的表示是对称的,所以我们只需要研究一半即可,也就是2048个点,2048个点也就是2048个向量

为什么是bins是10.77HZ呢?

由于我们的采样率是44100HZ,根据香农采样定律,我们能表示的频率范围是0~22050HZ,那么在频域表示上,我们的总频带是0~22050,中间分布2048个点,所以,我们每个bins是22050/2048=10.766HZ 




  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值