什么是滑窗?:
什么是滑动(移动)窗口?为了提升数据的准确性,将某个点的取值扩大到包含这个点的一段区间,用区间来进行判断,这个区间就是窗口。举个例子,CCF乘用车销量预估比赛我们有一列属性关于每月的某种车型的新闻评论量,假设我的滑窗大小是3center设置为True的话,则意味着我用2016-9到2016-11三个月的均值取代2016-10对应的值。
滑窗的具体操作:
因为CSDN使用jupyter显示代码非常难看,所以给的是截图,原始代码在最下面。第一个是原始数据
统计窗口大小是3,使用均值代替之前的值:
统计窗口大小是3,使用求和代替之前的值:
统计窗口大小是3,使用方差代替之前的值:
# 以上操作的所有代码
import pandas as pd
import numpy as np
df = pd.DataFrame(np.array([[0, 2, 1, 1, 2], [1, 5, 2, 1, 2], [0, 5, 3, 1, 2], [7, 8, 4, 2, 3], [1, 5, 5, 2, 3], [1, 5, 6, 2, 3],
[1, 2, 7, 2, 3]]),
columns=['label', 'popularity', 'mt', 'model', 'adcode'])
df['mt_rolling_mean'] = df['mt'].rolling(window=3,center=True).mean()
df['mt_rolling_sum'] = df['mt'].rolling(window=3,center=True).sum()
df['mt_rolling_var'] = df['mt'].rolling(window=3,center=True).var()