从基础统计了解大型运算符

大型运算符\Sigma(Sigma)。

加总消费金额

总消费金额=x_{1}+x_{2}+...+x_{n}

在数学的应用中有一个加总(或称求和)符号\Sigma,这个符号念Sigma。使用下列公式表达:

\sum_{i=1}^{n}x_{i}=x_1+x_2+...+x_n

便利商店10位顾客的消费记录如下,计算总消费金额。

66,58,25,78,58,15,120,39,82,50

x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print('总消费金额 = {}'.format(sum(x)))

运行结果如下:

[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
总消费金额 = 591

[Done] exited with code=0 in 0.281 seconds

计算平均单笔消费金额

在统计或数学领域,计算平均值时可以在平均值变量上方增加一条横线,代表平均值,如下所示:

\bar{x}

平均值变量可以读作x bar。

使用下列公式表达平均值:

\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i=\frac{x_1+x_2+...+x_n}{n}

销售数据计算平均消费金额:

x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print('平均消费金额 = {}'.format(sum(x)/len(x)))

运行结果如下:

[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\ch19_2.py"
平均消费金额 = 59.1

[Done] exited with code=0 in 2.244 seconds

在numpy模块中有mean()方法,可以直接建立 平均数。

使用numpy模块的mean()方法,建立销售数据 的平均数。

import numpy as np

x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print('平均消费金额 = {}'.format(np.mean(x)))

运行结果如下:

[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
平均消费金额 = 59.1

[Done] exited with code=0 in 17.905 seconds

方差

方差的英文是variance,主要是描述系列数据 的离散程度,即所有数据与平均值的偏差距离。

假设有2个数据如下:

(10,10,10,10,10)                #平均值是10

(15,5,18,2,10)                #平均值是10

当计算两个数据的每个元素与平均值的距离时:

(0,0,0,0,0)                #第一组数据

(5,-5,8,-8,0)                #第二组数据

即使两组数据有极大差异,但是直接加总每个元素与平均值的距离会造成失真,原因是每个元素的偏差距离有正与负,在加总时正与负之间抵消了,所以正式定义方差时,是先将每个元素与平均值的距离做平方,然后加总,再除以数据的数量。下列是计算方程的步骤:

(1)计算数据的平均值。\bar{x}

(2)计算每个元素与平均值的距离,同时取平方,最后加总。

(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots +(x_n-\bar{x})^2

(3)方差最后计算公式如下:方差=\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots +(x_n-\bar{x})^2}{n}

若是使用\Sigma符号,可以得到下列方差公式:

方差=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2

销售数据,计算方差:

x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
mean = sum(x) / len(x)

# 计算变异数
var = 0
for v in x:
    var += ((v - mean)**2)
var = var / len(x)
print("变异数 : ", var)

运行结果:

[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
变异数 :  823.49

[Done] exited with code=0 in 1.156 seconds

使用numpy模块的var()方法,建立销售数据的方差。

import numpy as np

x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print("变异数 : ",np.var(x))

运行结果:

[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
变异数 :  823.49

[Done] exited with code=0 in 3.03 seconds

标准偏差

标准偏差的英文是Standard Deviation,编写是SD,计算方差后,将方差的结果开根号,可以获得平均距离,所获得的平均距离就是标准偏差。

标准偏差=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2}

计算标准偏差。

x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
mean = sum(x) / len(x)

# 计算变异数
var = 0
for v in x:
    var += ((v - mean)**2)
sd = (var / len(x))**0.5
print("标准偏差 : {0:6.2f}".format(sd))

运行结果如下:

[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
标准偏差 :  28.70

[Done] exited with code=0 in 0.758 seconds

在numpy模块有std()方法,可以直接建立标准偏差。

import numpy as np

x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print("标准偏差 : {0:6.2f}".format(np.std(x)))

运行结果如下:

[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
标准偏差 :  28.70

[Done] exited with code=0 in 2.563 seconds

\Sigma符号运算规则与验证

\sum_{i=1}^{n}(x_i+y_i)=\sum_{i=1}^{n}x_i+\sum_{i=1}^{n}y_i

\sum_{i=1}^{n}(x_i-y_i)=\sum_{i=1}^{n}x_i-\sum_{i=1}^{n}y_i

\sum_{i=1}^{n}cx_i=c\sum_{i=1}^{n}x_i

\sum_{i=1}^{n}c=nc

活用\Sigma符号

省略

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值