kaggle竞赛宝典 | 两大Kaggle时序金牌级强特

本文来源公众号“kaggle竞赛宝典”,仅用于学术分享,侵权删,干货满满。

原文链接:两大Kaggle时序金牌级强特。

简介

今天介绍在时间序列中非常强势的两个特征,这些特征在一些序列问题分类以及回归问题中起到非常大的作用,在非常多的问题中都展现了极好的效果。

时间序列强特

01 Fourier 变换

傅里叶变换是一种将时序信号分解为其频率分量的数学技术。它基于如下原理:

  • 任何信号都可以分解为一系列具有不同幅度、频率和相位的正弦波。

通过捕获数据中的周期性模式,傅里叶变换可以帮助我们识别隐藏的结构和趋势。

傅里叶变换可分为两类:用于连续信号的连续傅里叶变换(CFT)和用于离散信号的离散傅里叶变换(DFT)。

快速傅里叶变换(FFT)是一种计算序列 DFT 的高效算法。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.fft import fft, ifft

time_series = np.random.random(200)

# Perform Fast Fourier Transform (FFT)
fft_values = fft(time_series)

# Get the magnitude and frequencies
fft_magnitude = np.abs(fft_values)
frequencies = np.fft.fftfreq(len(time_series))

02 自相关和偏自相关

  • 自相关,也称为自协方差函数或序列相关, 用于衡量时序数据点在不同滞后时间上的线性关系。

  • 偏自相关,用于衡量在去除较小滞后时间上其他数据点影响后,两个数据点在不同滞后时间上的相关性.

from statsmodels.tsa.stattools 
import acf, pacf 
data = np.array([...])   
lags             = 10 
autocorr         = acf(data, nlags=lags) 
partial_autocorr = pacf(data, nlags=lags)
 

适用问题

适用于所有时序问题。

THE END!

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

  • 7
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值