数据学习(三)-理论的实践

集中趋势
离散趋势
分布形状

数据的读入
在这里插入图片描述
基本数据的描述在这里插入图片描述
包括平均数,标准差,最小、最大值,四分位数,中位数。

#求众数
counts = np.bincount(data['data'])
#返回众数
np.argmax(counts)

#众数为:


```python
#求解四分位差
a=np.percentile(data, (25, 50, 75), interpolation='midpoint')
Q=a[2]-a[0]
Q
#四分位差 为:

结果如下所示:
在这里插入图片描述
在这里插入图片描述

#求方差
#求方差
ave=data.mean()
ave
su=0
for i in data['data']:
    su+=pow(abs(ave-i),2)
su=su/(data['data'].count()-1)
s=np.sqrt(su)
print("方差为:",su)
print("标准差为:",s)
#方差为:
#标准差为:

结果如下所示:
在这里插入图片描述

#求异纵比率

#首先求众数的频数
num_M=data[data['data']==1].count()
print("众数的频数为:",num_M)

#然后非众数的频数
num_pM=data['data'].count()-num_M
print("非众数的频数为",num_pM)

V=1-num_M/data['data'].count()
print("异纵比率为:",V)

结果如下:
在这里插入图片描述
上述结果可以看出异纵比率的值是0.7925,说明数值较大,说明非众数的频数越高。

#求标准分数
z=[]
for i in data['data']:
    a=(i-ave)/s
    z.append(a)
print("标准分数位:",z)

结果如下所示:
在这里插入图片描述

#求离散系数
v=s/ave
print("离散系数为:",v)

在这里插入图片描述
上述结果可知离散系数值为0.636915,说明离散系数不是特别大,说明数据的离散程度没有特别大。

#求偏态系数
n=data['data'].count()
s3=0
for i in data['data']:
    s3+=pow(i-ave,3)
sk=(n*s3)/((n-1)*(n-2)*pow(s,3))
print("偏态系数为:",sk)

结果如下所示:
在这里插入图片描述
从上述结果可知,偏态系数值为0.592859,不为0,说明数据分布是非对称性的。

#求峰态系数
s4=0
s2=0
for i in data['data']:
    s4+=pow(i-ave,4)
    s2+=pow(i-ave,2)
k=(n*(n+1)*s4-3*(n-1)*pow(s2,2))/((n-1)*(n-2)*(n-3)*pow(s,4))
print("峰态系数为:",k)

结果如下所示:
在这里插入图片描述
从上述结果可知,峰态系数值为-0.623715,由于K小于0,说明电脑销售量的分布于正态分布相比略有一些平峰。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值