描述统计-变异程度

世界是运动的,运动是永恒不变的,唯一不变的就是变化。

有很多方法可以度量变化,比如时间,时间就是度量事物变化的一个量度。时间不能表示自己,只能通过事物的变化来度量。

距离,我们通过脚步或者尺码来度量,自己行走的路程。

一个点的水平运动,形成了一条线

一条线的水平运动,创造了一个面

如果要把一个面拎起来,各个点的运动就形成了一个三维立体。

描述或分析一个事物,一个现象,除了需要掌握它的一般表征,数据中心的位置,同时还要了解事物和现象的变异程度也就是离散程度,变动大小更好的描述一个事物。初步表征他变化的规律。

数据分析就是扎根历史,展望未来,通过历史的数据去推断未来的可能性。

统计学通过长久的发展,有几个经典的度量变异值的方法。

1.极差=最大值-最小值。最大值和最小值的差往往能够反映,一个物体运动的宽度。比方说一个人做一道菜,刚开始不太会,做的慢,大约需要30分钟,天天做,天天做,现在已经十分熟练,那么他的极差,也就是最大的差距是25分钟。或者从北京到青岛,有各种的方法,火车,长途车,自驾,飞机等等,他用飞机的时间最短,2小时,长途车的时间最长8个小时,极差也就是6个小时。极差反映的是一个事物的变化,完成这个变化本身造成其他度量的最大变化幅度。他设定了一个面,所有的变化都在这个面里。

极差是一个面,很少单独表示事物的变化。我们需要看到更多的面。

SQL: MAX(x)-MIN(x)

EXCEL:MAX(x)-MIN(x)

R语言:x<-c(1,2,3,4)

             range(x)的返回值为c(1,4)

             diff(range(x)) 返回值为3

2.四分位数间距。IQR=Q3-Q1.他表示的是中间50%的数的极差。

3.方差。大学中学好像都学过,是一种规定的表示离散程度的方法.总体方差的分母为n,样本方差的分母为n-1 达到无偏的效果。其实绝对值和四次方都能表示离散程度,只是绝对值会产生尖点,不容易做导数。人们一般都会重点关注异常的部分,平方可以让异常适当加权,但又没有加权的很剧烈的位置。同时方差更加容易计算。

n-1

SQL 语句:VARP 总体方差  VAR 样本方差

EXCEL 语言: VARP 总体方差  VAR 样本方差

R 语言 : VAR

4.标准差。标准差是方差的开方。是方差的下一步。标准差与原始数据的单位相同,更容易与平均数等其他计量单位进行比较。股票基金投资风险,一般是用标准差表述。

同时根据正态分布,99.7%的数据在【avg+-3*标准差】这个区间内。

SQL 语句: STDEVP 总体标准差 STDEV 样本标准差

EXCEL : STDEVP 总体标准差, STDEVA 基于样本估计的标准偏差, STDEV 样本标准差

R 语言: sd(x)

5.标准差系数。标准差相对于平均数的描述统计量。

总体标准差系数的计算公式为Vσ= σ/ x ×100%

在平均数和标准差都不相同的情况下,比较他们的变异程度一种有用的统计量。

 

通过这些数据,根据不同的需要,我们可以掌握事物运动的一般形态。

如果是预测未来,那么事物变动越小的,未来变动很大的可能性就小,更容易做推断。

 

转载于:https://www.cnblogs.com/wutongyuhou/p/4465913.html

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值