本文章为一篇总结文,记录了自己参加”2020年华为财务精英挑战赛“的一些个人感想。
前一阵子我在刷Leetcode时,突然有一位本科学财经的同学微信我,邀请我组队参加这个比赛,原因是她们之中没有会”计算机“的同学。在了解了相关情况后,我发现这个比赛可能会涉及到数据分析,需要用到Python一类的编程语言,于是我就答应了。虽然自己专业方向不是数据分析,但我想,参加这个比赛或多或少可以增长自己的见识,锻炼自己的能力吧。
上周,也就是4月18日,赛题放出来了。因为华为的保密协议,它的案例不能被公开,因此我就晦涩地叙述下有关数据分析那一块的工作吧。
题目列出了各地区往年至2019年的2G,3G,4G以及整体的市场规模,让参赛人员自行推测出2020年四个季度的各地区5G市场规模和整体市场规模(不借助额外数据)。
我一看这题,只能通过”时间“因变量去推算市场规模,顿时就想起了线性回归。但在输出了各地区市场规模的折线图后,我发现规模与时间不呈线性关系。经历了一番面向百度与Google的搜索后,我发现”时间序列分析法“似乎很切合这道题,于是采用了旗下的ARIMA模型,原因是它可以在已有的和时间有关的数据序列的基础上构建其数据模型并预测其未来的数据。
整个建模与预测过程感觉像是在本科参加数学建模大赛一样,在极短时间内学习全新的知识,并运用它完成案例分析。这个过程中我走了不少弯路,尤其是关于差分那块内容。想使用ARIMA模型,必须满足的前提条件是数据平稳。所谓平稳,就是随着时间变化,数据本身不会呈现明显的上升或下降趋势,而官方给出的数据基本都是总体呈上升趋势。因此,为了平稳化,