时间序列的趋势可以分为线性趋势和非线性趋势两大类,倘若这种趋势能够延续到未来,就可以利用趋势进行外推预测。
有趋势序列的预测方法主要有线性趋势预测、非线性趋势预测和自回归模型预测等。但本篇主要介绍线性趋势和非线性趋势的预测方法。
线性趋势:是指现象随着时间的推移而呈现出稳定增长或下降的线性变化规律。
指数曲线:用于描述以几何级数递增或递减的现象,即时间序列的观察值按指数规律变化,或者说时间序列的逐期观察值按一定的比率增长或衰减。
多阶曲线:有些现象的变化形态比较复杂,它们不是按照某种固定的形态变化,而是有升有降,在变化过程中可能有几个拐点。
python实践以下面的数据展开:
# 先导入相关包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文字体
plt.rcParams['axes.unicode_minus'] = False # 显示负号
# 导入以上数据
files_path = "E:\\xx_python实践\\"
df = pd.read_excel("时间序列.xlsx")
df["t2"] = df["t"]**2 # 为二阶曲线做准备
df["t3"] = df["t"]**3 # 为三阶曲线做准备
拟合线性趋势线
def linear_trend(x, y):
lreg = LinearRegression()
lreg.fit(x, y)
coef = round(lreg.coef_[0][0],4)
intercept = round(lreg.intercept_[0], 4)
pred = lreg.predict(x)
plt.plot(pred)
plt.title("线性趋势方程 yt={} + ({})t".format(intercept, coef))
plt.show()
return (intercept, coef)
linear_trend(df[['t']], df[['y']])
拟合二阶曲线
def second_order_trend(x, y):
lreg = LinearRegression()
lreg.fit(x, y)
coef = lreg.coef_[0]
intercept = round(lreg.intercept_[0], 4)
pred = lreg.predict(x)
plt.plot(pred)
plt.title("二阶曲线 yt={} + ({})t + ({})t**2".format(intercept, round(coef[0],4), round(coef[1], 4)))
plt.show()
return (intercept, coef)
second_order_trend(df[['t','t2']], df[['y']])
拟合三阶曲线
def third_order_trend(x, y):
lreg = LinearRegression()
lreg.fit(x, y)
coef = lreg.coef_[0]
intercept = round(lreg.intercept_[0], 4)
pred = lreg.predict(x)
plt.plot(pred)
plt.title("三阶曲线 yt={} + ({})t + ({})t**2 + ({})t**3".format(
intercept, round(coef[0],4),round(coef[1], 4), round(coef[2], 4)))
plt.show()
return (intercept, coef)
third_order_trend(df[['t','t2', 't3']], df[['y']])
拟合指数趋势线
def exp_trend(x, y):
y = np.log(y)
lreg = LinearRegression()
lreg.fit(x, y)
coef = np.exp(lreg.coef_[0][0])
intercept = np.exp(lreg.intercept_[0])
pred = x.applymap(lambda x: round(intercept * math.pow(coef, x), 2))
plt.plot(x, pred)
plt.title("指数曲线方程 yt={} x {}**t".format(round(intercept,3), round(coef, 3)))
plt.show()
return (intercept, coef)
exp_trend(df[['t']], df[['y']])
##############################################################
@ 2020.03.018木居居士的统计学小组 第十七周 打卡
安利公益监督学习组织 - 【公众号】数据科学家联盟
https://mp.weixin.qq.com/s/1WWmbLZucz9vIp-4tKKQ5Q
感谢木东大佬、饼干大佬、南头大佬、星空妹砸、Desitiny、 DD-Kylin的无私付出,抱拳ing~