阿里云大数据认证——使用时间序列分解模型预测商品销量-课堂笔记

阿里云Clouder认证

一、价格弹性时间序列分解模型预测商品销量

1. 课程目标

(1) 掌握商品销量预测的相关概念
(2) 了解预测方法的适用场景
(3) 阿里云产品构建商品销量预测模型
(4) 根据预测模型制定商品运营策略

(5)目录
	- 商品销售预测介绍
	- 时间序列分解模型详解   
	- 相关阿里云产品介绍
	- 任务:搭建商品销售预测模型	
复制代码

2. 商品销量预测介绍

(1)商品销量预测
  • 在充分考虑未来各种影响因素的基础上,根据历史销量以及市场上对产品需求的变化情况,对未来一定时期内产品的销量变化所进行的科学预计和推测。
(2)商品销量预测的特点
  • **连贯性:**把过去和现在与未来联系起来,利用过去和现在的数据推导将来的变化。
  • **相关性:**在宏观上,销量的变化同国家经济状况、家庭收入水平、消费需求结构等因素密切相关;在微观上,需求的变化和商品的价格、渠道、备货量、广告等因素密切相关,这些因素之间存在相互制约、相互依存 的关系。
  • **混沌性:**一方面所有的企业都是复杂的开放系统,另一方面环境本身瞬息万变。
(3)商品销量预测的作用
  • 指导运营策略

    • 产品定位
    • 定价策略
    • 分销渠道
    • 促销方式
    • 库存运输
    • 生产计划
    • 原料采购

  • 指定战略决策

    • 消费需求
    • 消费行为
    • 目标人群
    • 总体动态
    • 资金投向
    • 经营方针
    • 发展规模

  • 提高企业竞争力

    • 掌握规律
    • 扬长避短
    • 挖掘潜力
    • 及时应变
    • 知己知彼
    • 见招拆招
    • 竞争策略
(4)商品销量预测如何指导运营策略
  • 销量预测不准确:畅销品断货&滞销品积压
  • 缺货怎么解决:补货、调货
  • 供应链的速度和成本:时尚类商品备货周期长、生鲜类商品运输成本高
  • 供应链优化

  • 需求价格弹性(Price Elasticity of Demand)
    • 是指需求量对价格变动的反应程度
    • 影响因素:替代品的数量和相近程度、商品的重要性、与时间和所占消费支出成正比
  • 库存怎么解决:优惠、打折
  • 促销手段和促销幅度:
    • 最终目标:提升利润
    • 利润=价格*销量-成本
  • 定价优化
(5)商品销量预测流程
  • **确定预测目标:**项目目标、预测范围、准确性要求 --> 基础
  • **分析整理数据:**收集数据、数据字典、数据流关系
  • **选择预测方法:**定性分析发(调查分析法,专家集合意见法,产品生命周期法)、定量分析法(因果预测法,时间序列法)
  • **建立预测模型:**数学模型(表达函数关系)
  • **编写预测报告:**解释和论证(讨论模型的 有效性 <预测准确度>和 泛用性 <是否适用其他产品、时间和地点>)

3. 商品销量预测方法

(1)因果预测法(回归法)
  • 根据事务之间的因果关系来预测事务的发展和变化,通过对预测目标有直接或间接影响因素的分析找出其变化规律,并根据这种变化规律来确定预测值。
  • 分类:一元线性回归(Yt ~ Xt)、多元线性回归(Yt ~ X1t, x2t, x3t)、自回归(Yt ~ Yt-1, Yt-2, Yt-3)
  • 通过促销手段、促销幅度等预测销量
(2)时间序列法
  • **时间序列:**也叫时间数列、历史复数或动态数列。它是将某种统计指标的数值,按时间先后顺序排列到所形成的数列。
  • 时间序列法:
    • 通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年可能达到的水平。
    • 时间序列分析法是一种特殊的回归分析法,不考虑事物之间的相关关系

    • 预测方法:
      • 简单平均法:
        • 把n个历史数值作为观察值,求出算术平均数作为下期预测值
        • 假设过去这样以后也会这样,适用于事物变化不大的趋势
      • 移动平均法:
        • 相继移动计算若干时期的算术平均数作为下期预测值
        • **公式:**Xt= 1/n (Xt-1+Xt-2+Xt-3+ ... +Xt-n) <n为周期数>
        • e.g. 计算X6的5步移动平均:X6=1/5(X5+X4+X3+X2+X1)
      • 指数平滑法:
        • 根据历史数据的上期实际值和预测值,用指数加权计算下期预测值进行预测,
        • **优点:**只需要上期的实际值和上期的预测值,节省数据和处理数据的时间,减少数据的储存量
        • **缺点:**没有包含远期数据,可能忽略信息,造成预测不够准确
      • 季节趋势法:
        • 根据每年重复出现的周期性季节变动,预测未来的季节性变动趋势
        • 一般使用季度、月度平均法(各年度的数值按季度或月度求和之后取算术平均值)

    • 影响因素:
      • **长期趋势(T):**现象在较长时期内受某种根本性因素作用而形成的总的变动趋势(近似直线持续向上、向下或者平稳)
      • **季节变动(S):**现象在一年内随着季节的变化而发生的有规律的周期性变动
      • **循环变动(C):**现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动
      • **不规则变动(R):**一种无规律可循的随机变动
(3)ARIMA
  • 定义:

    • 自回归移动平均模型(Autoregressive Integrated Moving Average Model)
    • 时间序列预测法,记作ARIMA(p,d,q),是统计模型(statistic model)中最常见的一种用来进行预测的模型

  • 参数和数学形式:

    • p-- 采用的时间序列数据本身的滞后数(lags),也叫Auto-Regressive项
    • d-- 时间序列变为平稳时所做的差分次数,也叫Integrated项
    • q-- 移动平均项数,也叫Moving Average项

  • 基本思想:将预测对象随时间推移而形成的非平稳时间序列转化为平稳时间序列,然后对因变量的滞后值以及随机误差项的现值和滞后值进行回归。这个模型一旦被识别后就可以从时间序列的过去值及现在值预测未来值。

  • 优点:

    • 模型借助内部的变量就可以进行预测,而不需要其他外在的变量,比较简单
    • 既考虑了数据在时间序列上的依存性,又考虑的随机波动的干扰性
    • 短期预测准确度高

  • 缺点:

    • 要求数据是稳定的,或者用过差分后是稳定的,如果经过差分后是不稳定的数据是无法捕捉到规律的(如股票数据)
    • 无法揭示定价或是促销类型对销量造成的影响以提升利润
(4)价格弹性时间序列分解模型

促销幅度(%) = (标准价格 - 定价) / 标准价格 * 100% (若无标准价格可用历史平均价格代替)
假设:需求价格弹性不因时间而波动

  • <1>. 训练集回归:真实销量q,促销幅度(%),促销类型
  • <2>. 回归系数:q = a + b * q + c * f
  • <3>. 训练集回归预测:销量Q
  • <4>. 训练集预测差值:q - Q = bQ
  • <5>. 训练集时间序列分解:dQ ~ U, T, C, S, R
  • <6>. 时间序列系数:U(序列平均值), T(序列长期趋势), C(序列季节变化), S(序列循环变动), R(序列不规则变动)
  • <7>. 测试集时间序列预测销量:dQ_f
  • <8>. 测试集回归预测销量:Q_f
  • <9>. 最终预测销量:dQ_f + Q_f
(5)模型优势
  • 洞察价格和促销手段对销量的影响
  • 根据需求价格弹性,更好地定价以提升利润
  • 还原时间对销量的真实影像
  • 基于产品生命周期更好地决策
  • 降低缺货概率,减少不必要的库存
  • 结合商业信息,改变循环变动C

4. 时间序列分解模型详解

(1)时间序列分解模型
  • 时间序列Xt可以表示为五个因素的函数 Xt = f(U, Tt, St, Ct, Rt) ,其中U代表了序列的平均值
  • 时间序列分解的方法有很多,常用的模型有加法模型和乘法模型:
    • 加法模型:
      • Xt = U + Tt + St + Ct + Rt
      • 适用于四个因素对现象的发展的影响是相互独立的
    • 乘法模型:
      • Xt = U * Tt * St * Ct * Rt
      • 适用于四个因素对现象的发展的影响是相互作用的
    • 大多数情况下都采用 乘法模型
(2)乘法模型分解步骤
  • Xt = U * Tt * St * Ct * Rt
  • 步骤一 移除平均值U
    • 第一步计算序列的平均值U,然后将序列中所有个体的值除以U来**移除平均值:**Yt = Xt / U
    • 创建了一个值在1左右的新序列Y
  • 步骤二 计算移动平均值M
    • 这一步计算Yt的L步移动平均,其中L是季节变动S的周期长度(例如季度序列 L=4 ;月度序列 L=12)
    • 由于移动平均算的是一年的平均值,季节性因素被移除:Mt = 1 / L (Yt-1 + Yt-2 + ... +Yt-L)
    • e.g. 计算M5的4步移动平均: M5 = 1 / 4 (Y4 + Y3 + Y2 + Y1)
  • 步骤三 计算长期趋势T
    • 这一步根据移动平均Mt,计算该序列的长期趋势Tt
    • 对**移动平均Mt进行线性回归:**Mt = a + b * t + et (其中a是截距,b是斜率,et是线性拟合的残差)
    • 上述等式的线性部分用于定义**长期趋势:**Tt = a + b * t
  • 步骤四 计算循环变动C
    • 循环变动等于**移动平均Mt除以长期趋势Tt:**Ct = Mt / Tt
  • 步骤五 计算季节变动S
    • 季节变动K等于Y序列除以**移动平均Mt:**Kt = Yt / Mt (注意:K序列是由季节变动和随机变动组成的)
    • 为了计算真正的季节变动S,取时间t所属**“季节”的K序列平均值:**St = Kt的平均值
    • e.g. 共三年(36个月)数据且L=12,S1 = (K1 + K13 + K25) / 3,S2 = (K2 + K14 + K26) / 3,...,S13 = (K1 + K13 + K25) / 3,S14 = (K2 + K14 + K26) / 3,...
  • 步骤六 计算不规则变动R
    • K序列除以**S序列:**Rt = Kt / St
  • 生成预测
    • 一旦时间序列分解完成,就可以很容易地生成预测:Xt = U * Tt * St * Ct * Rt
      • 长期趋势Tt = a + b * t
      • 季节变动St = Kt的平均值
      • 循环变动Ct是手动输入的(或取训练集Ct的平均值)
      • 不规则变动Rt则设为1

5. 相关阿里云产品介绍

(1)销量预测面临的挑战
  • **海量计算:**海量商品交易数据,可能还要下钻到更细的维度,计算量和成本比较可观。
  • **数据挖掘:**需要一定的数据开发能力,能够实现数据清洗,特质处理,调节参数,回归和预测等。
  • **部署调度:**由于长期预测的精度不够,所以必须周期性地根据新的数据重跑模型,做好能自动化调度和监控报警。
  • **数据仓库:**不同的业务数据可能存放在不同的系统中,不能互相连通,没法及时更新,形成了数据孤岛。

转载于:https://juejin.im/post/5c726f216fb9a049fa106471

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值