简析方差、标准差与数值离散程度

本文介绍了方差和标准差的概念,它们是衡量数据离散程度的重要指标。方差是各数据点与均值之差的平方和的平均数,而标准差是方差的平方根。通过示例数据集A和B的对比,展示了方差越大,数据的离散程度越高。此外,通过调整sklearn.datasets.samples_generator.make_blobs的cluster_std参数,进一步阐述了标准差如何影响数据分布的离散程度。
摘要由CSDN通过智能技术生成

方差(variance): 变量与其均值的差的平方和除以(变量数+1)。

   如有一组数据: [1,2,3,4,5], 其均值就是 (1+2+3+4+5) / 5 = 3

   所以其方差为: ((1-3)^2 + (2-3)^2 +(3-3)^2 + (4-3)^2 + (5-3)^2) /( 5+1) = 1.6666....

  

 

标准差(standard deviation):方差的算术平方根

  

 

方差和标准差反应了一组数据的离散程度:

当方差越小时,数据的离散程度越小

而当方差越大时,数据的离散程度也就越大。

如有两组数据

A = [1,2,3,4,5]

B=[1,5,7,9,11]

A 的方差为2 、B的方差为11.84 ,从方差的大小比较,var(A)<var(B)

所以B的离散程度比A的离散程度高

 

为什么方差可以体现数据的离散程度

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值