目录
一、Savitzky-Golay平滑
1、Savitzky-Golay平滑的参数
在 Savitzky-Golay 平滑中,window_length 和 polyorder 是两个重要的参数,用于控制平滑的效果。
- window_length 表示窗口的长度,它指定了用于拟合每个数据点的邻近数据点的数量。较大的 window_length会导致更平滑的曲线,但可能会模糊细节。一般来说,window_length 的取值范围通常是 5 到 101 之间的奇数。
- polyorder 表示拟合多项式的阶数,它决定了拟合曲线的灵活性。较高的 polyorder可以更好地适应复杂的数据模式,但也容易引入拟合噪声。一般来说,polyorder 的取值范围通常是 1 到 5之间的整数。需要根据具体的数据和平滑需求来选择合适的参数。
一种常见的做法是尝试不同的参数组合,并观察平滑后的效果,根据需要逐渐调整参数值。你可以通过可视化结果或其他评估指标来判断哪组参数能够达到最佳的平滑效果。
2、代码实现
使用python实现很简单,只需要调用savgol_filter函数即可。
from scipy.signal import savgol_filter
filtered_y = savgol_filter(y, window_length, polyorder)
二、Whittaker平滑
1、Whittaker平滑的参数
- y: 需要进行平滑处理的长时间序列数据。
- r : 平滑的权重。
- d: 粗糙度的权重。
2、代码实现
import numpy as np
def ws(y, r, d):
y = np.array(y, dtype=np.float64)
m = y.size
E = np.eye(m)
D = np.diff(E, n=d, axis=0)
t = E + r * np.dot(D.T, D)
filtered_y = np.dot(np.linalg.inv(t), y.T)
return filtered_y
三、三种评判平滑质量的指标
1、平均绝对误差MAE
代码:调用sklearn.metrics中的mean_absolute_error函数
from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(filtered_y, y)
2、均方根误差RMSE
代码:调用sklearn.metrics中的mean_squared_error函数
from sklearn.metrics import mean_squared_error
rmse = sqrt(mean_squared_error(filtered_y, y))
3、相关系数CC
代码:调用numpy中的corrcoef函数
import numpy as np
cc = np.corrcoef(filtered_y, y)