时间序列交叉验证法_sklearn调用_及prophet交叉验证函数实现

最新推荐文章于 2024-02-26 10:08:54 发布

VIP文章 hlmandy

最新推荐文章于 2024-02-26 10:08:54 发布

阅读量5.6k

点赞数 3

分类专栏：时间序列文章标签： python 人工智能

本文链接：https://blog.csdn.net/qq_42257962/article/details/108318644

版权

文章目录

搞这个的初衷一是想对时间序列预测结果进行交叉验证；二是想和prophet自带的交叉验证方法进行比较。
然而sklearn自带的时序交叉验证包并不是那么好用，不太灵活，就决定自己写一个。

1. 时间序列特定的交叉验证方法简介

时间序列不能采用一般的K-FOLD校验，具体的原理可以看机器之心翻译的这篇文章：

一文简述如何使用嵌套交叉验证方法处理时序数据

时间序列一般采用递增时间窗交叉验证法，如下图所示：

在这里插入图片描述

2. sklearn时间序列交叉验证包TimeSeriesSplit

sklearn.model_selection.TimeSeriesSplit的包默认为递增窗口交叉验证。

官方doc及sample如下：

class sklearn.model_selection.TimeSeriesSplit(n_splits=5, ***, max_train_size=None)

Parameters

n_splitsint, default=5 --把时间序列数据拆成几份

Number of splits. Must be at least 2.Changed in version 0.22: n_splits default value changed from 3 to 5.
max_train_sizeint, default=None --限制每次training的大小。如果不设置，则默认从头开始训练（如上图所示）；如果设置，就可以控制成固定的moving window。见下文的example。

Maximum size for a single training set.

递增窗口交叉验证Example

>>> import numpy as np
>>> from sklearn.model_selection import TimeSeriesSplit
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([1, 2, 3, 4, 5, 6])
>>> tscv = TimeSeriesSplit()
>>> print(tscv)
TimeSeriesSplit(max_train_size=None, n_splits=5)
>>> for train_index, test_index in tscv.split(X):
...     print("TRAIN:", train_index,

最低0.47元/天解锁文章

hlmandy

关注

3
点赞
踩
48

收藏

觉得还不错? 一键收藏
2
评论
时间序列交叉验证法_sklearn调用_及prophet交叉验证函数实现

文章目录1. 时间序列特定的交叉验证方法2. sklearn时间序列交叉验证包TimeSeriesSplit递增窗口交叉验证Example固定窗口交叉验证Examplesklearn TimeSeriesSplit包的局限性：其他包&自己实现tscv包自己写Ref:1. 时间序列特定的交叉验证方法关于为何时间序列不能采用一般的K-FOLD校验，机器之心翻译的这篇文章说的很清楚：一文简述如何使用嵌套交叉验证方法处理时序数据时间序列一般采用递增时间窗交叉验证法，如下图所示：2. sklear
复制链接

扫一扫