信号处理技术在机器学习中的应用(三)

这是一个学习总结。

原文连接:

Machine Learning with Signal Processing Techniques – ML Fundamentals

3.统计参数估计与特征提取

¢ FFT PSD 、自相关函数都是用来计算信号的特征
¢ 这些函数把信号从时域转换到频域,并且给出频谱
¢ 信号转换到频域后,利用频域的特征作为训练数据集 就可以使用一些标准的分类器去分类,例如 Random Forest, Logistic Regression, Gradient Boosting or Support Vector Machines.
¢ 可以提取的特征是:频率振荡的位置以及对应的振幅,即频谱中峰的 x 轴和 y 轴的
¢ 频域的峰检测( peak-detection

https://nbviewer.jupyter.org/github/demotu/BMC/blob/master/notebooks/DetectPeaks.ipynb

如上图,FFTPSD、自相关函数中峰的位置作为输入到分类器的特征 。

例子:人类活动的分类

¢ 30 个年龄在 19 48 岁的人
¢ 用感应器收集做 6 个动作的信号

 

¢ 测量的频率是 50Hz
¢ 过滤掉噪音后,信号被分割成固定大小为 2.56 秒的窗口,窗口与窗口间有重叠 1.28
¢ 因此,每个信号一共有 50*2.56=128 个点

 

¢ 智能手机会测量 three-axial linear body acceleration (三轴线性加速度) , three-axial linear total acceleration (三轴线性总加速度) and three-axial angular velocity (三轴角速度)
¢ 因而,总的信号是由 9 个部分组成的

 关于数据以及从数据中提取特征

¢ 训练集是一个数组,大小为( 7352 128 9 );测试集为( 2947 128 9 )。可见训练集有 7352 个信号,测试机有 2947 个信号。每个信号的长度是 128 ,且每个信号有 9 个部分组成
¢ 可视化:信号的 9 个组成部分,经过 FFT PSD 、自相关函数后的 9 个组成部分、这三种转换的 峰值
¢ 如何从信号提取特征:信号经过 FFT PSD 、自相关函数之后,使用 peak-detection 的方法得到峰的 位置
¢ 提取特征后得到的行数训练集是 7352 ,测试集的行数是 2947 。列数要看你取的特征的多少个。原文写道:The number of columns in each matrix depends on your choice of features. Each signal has nine components, and for each component you can calculate either just the FFT or all three of the transformations. For each transformation you can decide to look at the first n peaks in the signal. And for each peak you can decide to take only the x value, or both the x and y values. In the example above, we have taken the x and y values of the first 5 peaks of each transform, so we have 270 columns (9*3*5*2) in total.
¢ 提取特征后就可以用一般的分类器去进行分类

 

 原文中接下来就是讲把这些提取的特征喂给机器学习的分类算法,其中用到了scikit-learn工具包。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值