6.3 统计学项目实战-APP用户数预测

1. 预测流程

在这里插入图片描述

  1. 理解目标,拆解问题
    对目标的了解越深,越有可能得到问题结论
  2. 选择方法,构建模型
  3. 验证效果,修正模型
  4. 输出预测结果
    结果应该以解决问题为目的

2. 预测的方法

在统计学、机器学习和深度学习领域都有相应的数据预测方法,各方法有不同适用范围和优劣势
在这里插入图片描述

3. 预测模型的评估

最终选择平均相对误差及R2 作为评估模型预测效果的指标
在这里插入图片描述

4. 实战

4.1 问题

历史正常业务发展的数据时间为2016年4月-2017年8月,需要预测2017年9月-2019年12月的数据。

在这里插入图片描述

4.2 问题分析与方法选择

  1. 线上和线下业务月度数据属于典型的时序数据;
  2. 历史数据量不多,且需要预测未来的数据量较多,不能单纯以历史数据来对未来数据进行预测,但需要外部其他变量辅助进行综合预测,以达到更高准确度;
  3. 业务数据增长呈现明显一定非线性趋势,模型中可考虑一定非线性因素,并与线性模型进行对比;
  4. 不考虑那些单纯以自身历史数据预测自身未来数据的模型,如ARIMA、LSTM这类方法,最终选择多元非线性和线性回归两大类预测方法进行对比,通过模型评估指标选择最优模型。

4.3 需要考虑的因素

4.3.1 时序数据自身因素

由于线下业务的用户数,随着时间变化自身存在趋势变化;又因历史业务数据量相对未来预测的数据量相对较少。因此,不能单一依靠自身历史数据进行预测,需借助外部影响因素进行辅助预测。

对于时序类数据,通常在建立模型前,需综合考虑是否存在长期趋势、季节变动、周期变动、不规则变动:
a)长期趋势:是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势;
b)季节变动:是指季度或月度的周期变化;
c) 周期变动:通常是指非周、月、年等自然周期内的规律性波动,由非季节因素引起的涨落起伏波形相似的波动;
d)不规则变动:通常它分为突然变动和随机变动。
在这里插入图片描述

4.3.2 外部因素

本次建立预测模型除了考虑业务用户数自身历史数据外,综合考虑行业专家经验以及数据可获得性,考虑的外部因素主要为电视行业中有线高清用户数、智能终端数、有线宽带数,以及与业务相关的企业员工数。其中行业相关数据来源于中国广播电视网络有限公司与格兰研究联合发布的历年《中国有线电视行业发展公报》。

在这里插入图片描述

5. 线下任务预测

5.1 筛选外部影响因素

在这里插入图片描述

5.2 建立非线性模型

5.2.1 根据线下业务用户数自身变化趋势,建立多种非线性预测模型

在这里插入图片描述在这里插入图片描述

5.2.2 加入外部因素优化模型

  • 由于有线高清用户数、智能终端数、有线宽带数、企业员工数四个因素自身也存在较高的相关性,同时纳入模型中会产生共线性影响,因此从相关程度由高到低逐个添加到上述模型中,通过R1和平均绝对误差最终决定只加入有线高清用户数和陕西总员工数两个因素

  • 模型R2从之前的0.883提高到1,模型预测效果有明显提升,模型预测效果非常理想。

y t = e ( − 4.526 + 16.163 / t ) + 6.484 x t 1 − 0.289 x t 2 y_{t} = e^{(-4.526+16.163/t)}+6.484x_{t1}-0.289x_{t2} yt=e(4.526+16.163/t)+6.484xt10.289xt2

yt为依然线下业务月增长率,t为第t个月,xt1为第t个月的有线高清用户数增长率,xt2为第t个月的陕西总员工数增长率

5.2.3 非线性模型预测结果

在这里插入图片描述

5.3 建立线性模型

5.3.1 通过主成分分析对四个外部因素进行降维,得到一个新变量F

在这里插入图片描述

5.3.2 将新变量F与自身业务历史数据共同建立线性模型

在这里插入图片描述

5.4 线性和非线性模型对比

最终根据奥卡姆剃刀原理(Occam’s Razor, Ockham’s Razor),又称“如无必要,勿增实体”,即“简单有效原理”。我们最终选择多元线性回归模型进行预测。
在这里插入图片描述

5.5 预测结果和效果

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值