描述统计方法(离散程度)

在这里插入图片描述
在这里插入图片描述
我们所要计算的方差是其各变量值与其均值离差平方的平均数,也是测量数值型数据离散程度的最重要的方法。
在这里插入图片描述
偏差是指模型输出与真实值之间的误差,即模型本身的精准度,方差是指模型输出结果与期望输出之间的误差,期望输出也就是输出的各个值的平均值,我们可以看到在 C 图中,虽然模型中的各个点距离中心都较远,也就是偏差较大,但是因为所有的点都在那个附近,所以模型的方差较小。
在这里插入图片描述
关于判断哪个数据的差异性更大时,一般的按照我们之前的认知都是标准差越大的话,数据的差异性就越大,但是那是建立在相同的基准之上的时候,在不同的基准之上的话就需要一个新的量纲-变异系数来衡量变异程度。

经过计算之后我们发现体重的变异程度相比身高的变异程度更大,因为体重的基准值更小。
下面我们就来看一下具体的代码实现。
一、极差

#S2.1 极差
range_d1 = ptp(data.iloc[:,1]) #以衣着为例
print('各省份衣着的极差为',np.round(range_d1,2))
#验证
range_dd = np.max(data.iloc[:,1]
          -np.min(data.iloc[:,1]))
print('max-min:',np.round(range_dd,2))
print('北京市8个指标的极差',
      np.round(ptp(data.iloc[0,:]),2))

从这里我们可以看到求极差是有专门的对应函数 ptp 的,同时我们也可以想到求极差可以直接用最大值减去最小值来求得,通过 ptp 函数求得之后可以再用最大值减去最小值来进行验证,两个结果也是相同的。
二、方差的计算

var_d1 = var(data.iloc[:,1])
print('衣着的方差为:',np.round(var_d1,2))

方差的计算也是可以直接选中要计算方差的那一行或者那一列,然后直接对其进行求解就可以了,同时还可以选择对其保留几位小数的操作。
三、标准差的计算

#S2.3 计算标准差
std_d1 = std(data.iloc[:,1])
print('各省份衣着的标准差为',
      np.round(std_d1,2))

标准差的计算原理与方差基本相同,只是表达式不同,同样可以通过 np.round 函数选择保留几位小数。
四、变异系数的计算

#S4.4 变异系数
vc_d1 = std(data.iloc[:,1]) /mean(data.iloc[:,1]) 
print('衣着的变异系数为:',np.round(vc_d1,2))

变异系数的计算没有专门的公式,就是通过计算公示的变形来计算变异系数。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值