文章目录
机械加工过程中,刀具铣削过程传感器监控数据均为时序数据,如下图所示,为没有固定规律的随机离散值,不能有效识别数据特征与磨损度的关系,因此需要进行特征提取,把原有的低维时序数据映射到高维表示,挖掘和构造输入数据的新特征,进而找出最能帮助模型拟合的输入(X)和输出(Y)特征。
很多预测性维护的场景(如旋转件、振动等)我们完全可以采用基于统计和信号的特征提取方法就能得到一些较好的特征,本文的特征提取方法主要包含三个角度:
- 基于统计的时域特征
- 基于频谱分析的频域特征
- 基于小波包能量的时频联合域特征
1 基于统计的时域特征
基于统计的时域特征,就是使用统计学方法如均方根、方差、最大值、最小值、偏斜度、峰度、峰峰值等提取出的新数据。
1.1 均方根(Root Mean Square, RMS)
均方根(Root Mean Square, RMS),是信号有效值的反映:
R M S = 1 n ∑ i = 1 n x i 2 R M S=\sqrt{\frac{1}{n} \sum_{i=1}^{n} x_{i}^{2}} RMS=n1i=1∑nxi2
1.2 方差(Variance)
方差(Variance),衡量随机变量或一组数据离散程度,是源数据和期望值相差的度量:
Var = 1 n ∑ i = 1 n ( x i − x ˉ ) 2 \operatorname{Var}=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} Var=n1i=1∑n(xi−xˉ)2
1.3 最大值(Max)和最小值(Min)
最大值(Max)和最小值(Min),表示在一定时间范围内数据的最强和最弱的程度:
Max = max ( X ) Min = min ( X ) \begin{array}{l} \operatorname{Max}=\max (X) \\ \operatorname{Min}=\min (X) \end{array} Max=max(X)Min=min(X)
1.4 偏度(Skewness)
偏度(Skewness)又称偏态系数,度量数据的概率密度曲线分布偏斜的方向和程度,即与平均值相比数据的非对称的程度特征。
Skew = E [ ( X − μ δ ) 3 ] = E X 3 − 3 E X E X 2 + 2 E 3 X ( E X 2 − E 2 X ) 3 / 2 = μ 3 μ 2 3 2 = μ 3 δ 3 \text {Skew}=E\left[\left(\frac{X-\mu}{\delta}\right)^{3}\right]=\frac{E X^{3}-3 E X E X^{2}+2 E^{3} X}{\left(E X^{2}-E^{2} X\right)^{3 / 2}}=\frac{\mu_{3}}{\mu_{2}^{\frac{3}{2}}}=\frac{\mu_{3}}{\delta^{3}} Skew=E[(δX−μ)3]=(EX2−E2X)3/2EX3−3EXEX