在使用机器学习等模型进行时序数据预测前,首先需要进行预测基线创建,通常该基线使用简单的统计方法进行创建。
一、基线的作用:
1、使用不同简单方法创建基线的过程中,发现时序数据的趋势规律;
2、为后续使用机器学习等预测模型时提供对比参照;
二、简单基线创建与选择(强生公司股票的季度每股收益数据)
1、训练数据与测试数据提取
df = pd.read_csv('jj.csv')
train = df[:-4]
test = df[-4:]
2、对历史数据进行简单统计或直接使用
a、历史数据平均值
test.loc[:, 'pred_mean'] = np.mean(train['data'])
b、最后一年(四季度)历史数据平均值
test.loc[:, 'pred_last_yr_mean'] = np.mean(train['data'][-4:])
c、最后一季度历史数据实际值
test.loc[:, 'pred_last'] = train['data'].iloc[-1]
d、最后一年每季度历史数据实际值