本文来源公众号“kaggle竞赛宝典”,仅用于学术分享,侵权删,干货满满。
原文链接:两大Kaggle时序金牌级强特。
简介
今天介绍在时间序列中非常强势的两个特征,这些特征在一些序列问题分类以及回归问题中起到非常大的作用,在非常多的问题中都展现了极好的效果。
时间序列强特
01 Fourier 变换
傅里叶变换是一种将时序信号分解为其频率分量的数学技术。它基于如下原理:
-
任何信号都可以分解为一系列具有不同幅度、频率和相位的正弦波。
通过捕获数据中的周期性模式,傅里叶变换可以帮助我们识别隐藏的结构和趋势。
傅里叶变换可分为两类:用于连续信号的连续傅里叶变换(CFT)和用于离散信号的离散傅里叶变换(DFT)。
快速傅里叶变换(FFT)是一种计算序列 DFT 的高效算法。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.fft import fft, ifft
time_series = np.random.random(200)
# Perform Fast Fourier Transform (FFT)
fft_values = fft(time_series)
# Get the magnitude and frequencies
fft_magnitude = np.abs(fft_values)
frequencies = np.fft.fftfreq(len(time_series))
02 自相关和偏自相关
-
自相关,也称为自协方差函数或序列相关, 用于衡量时序数据点在不同滞后时间上的线性关系。
-
偏自相关,用于衡量在去除较小滞后时间上其他数据点影响后,两个数据点在不同滞后时间上的相关性.
from statsmodels.tsa.stattools
import acf, pacf
data = np.array([...])
lags = 10
autocorr = acf(data, nlags=lags)
partial_autocorr = pacf(data, nlags=lags)
适用问题
适用于所有时序问题。
THE END!
文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。