许栩原创专栏《从入门到高手:线性回归分析详解》第10章,最后一章,完结篇,用线性回归分析做预测,多元线性回归分析预测的十大步骤。【本章免费,专栏链接请点击文末左下角“阅读原文”】
前9章,我分别讲述了回归分析及与回分析相关的概念,一元、多元线性回归分析的公式与计算方法,以及多重共线性、回归方程的精度、显著性验证和置信区间等进行回归分析的重要步骤及其计算方法。至此,以回归分析进行需求预测的各项知识点及各项准备工作全部完成,我们可以正式的以回归分析进行需求预测。
本章,也是本专栏的最后一章,我将详细讲解用多元回归分析进行需求预测的十大步骤:数据收集、数据清洗、列出所有的变量、确定纳入回归方程的自变量、确定并消除多重共线性、求解多元回归方程、确认回归方程的精度、显著性验证、计算置信区间、正式预测。(本专格栏总目录见下图)
一、数据收集。
我们做统计,进行数据分析,首先的,都是需要有数据。有数据才能统计,有数据才能进行数据分析。以回归分析做需求预测,同样需要有数据,最先开始的,是数据收集。
数据收集是按照确定的数据分析和框架内容,有目的的收集、整合相关数据的一个过程。
从上面数据收集的定义可以看出,数据收集需要有明确的目的,即我们先要确定我们是为了什么事而去收集数据。我们的主题是用回归分析进行需求预测,在这里,我们收集数据的目的非常明确,收集数据是为了有效的采用回归分析的方法来进行需求预测。我们需要收集的,就是与这个目的相关的数据,比如销量数据(因变量),以及各种影响销量因素的数据(自变量)等等。
这些数据一般来源于我们日常的记录(含人工记录与系统生成),比如生产原始单据与报表、出入库报单、销售数据、促销信息、重大事件特殊事件记录、调查与调研信息等等。
二、数据清洗。
我们收集到