判断数据变化的标准以及预测、异常预警模型:
1均值一般采用平均数。如果有偏差非常大的异常值,即不仅超过此范围,并且是远远超出平如果均数很多的异常值,则均值采用中位数替代
中位数即从小到大排序时第50%n 个数。
如果n为奇数,则排序后第(n+1)/2个数即为中位数
如果n 为偶数,则排序后第n/2个数和第(n/2+1)个数的平均数为中位数
2趋势一般采用差额分析或者比率分析法,在时间序列上比较两期或多期差额或者环比比率;
预测可以采用均数预测、
如果考虑到影响因素可以采用简单的线性回归预测:因变量跟自变量的线性关系y=a+bx
但要注意:方程的确定性系数R2,方程中变量X对Y的解释程度。R2取值在0到1之间,越接近1,表明方程中X对Y的解释能力越强
3异常值的判定首先来自于业务经验 项目中的异常值是输出给报警系统,标记一下。
找异常值方法:
1) 用均数+/- STDEV*1.96来区分异常值;
2) 用均数+/- IQR*1.5来区分异常值;
偏差通过方差、标准差来解释,反应数据的稳定性
标准差的公式为σ=sqrt((∑(X1-Xmean)^2)/(n-1))
公式:mean(平均数)+/-IQR*1.5给出范围。IQR=Q3-Q1。
假设一共有n 个数据。Q3=排序之后的第0.75n个值。Q1=排序之后的第0.25n个值