大型运算符(Sigma)。
加总消费金额
总消费金额=
在数学的应用中有一个加总(或称求和)符号,这个符号念Sigma。使用下列公式表达:
便利商店10位顾客的消费记录如下,计算总消费金额。
66,58,25,78,58,15,120,39,82,50
x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print('总消费金额 = {}'.format(sum(x)))
运行结果如下:
[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
总消费金额 = 591
[Done] exited with code=0 in 0.281 seconds
计算平均单笔消费金额
在统计或数学领域,计算平均值时可以在平均值变量上方增加一条横线,代表平均值,如下所示:
平均值变量可以读作x bar。
使用下列公式表达平均值:
销售数据计算平均消费金额:
x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print('平均消费金额 = {}'.format(sum(x)/len(x)))
运行结果如下:
[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\ch19_2.py"
平均消费金额 = 59.1
[Done] exited with code=0 in 2.244 seconds
在numpy模块中有mean()方法,可以直接建立 平均数。
使用numpy模块的mean()方法,建立销售数据 的平均数。
import numpy as np
x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print('平均消费金额 = {}'.format(np.mean(x)))
运行结果如下:
[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
平均消费金额 = 59.1
[Done] exited with code=0 in 17.905 seconds
方差
方差的英文是variance,主要是描述系列数据 的离散程度,即所有数据与平均值的偏差距离。
假设有2个数据如下:
(10,10,10,10,10) #平均值是10
(15,5,18,2,10) #平均值是10
当计算两个数据的每个元素与平均值的距离时:
(0,0,0,0,0) #第一组数据
(5,-5,8,-8,0) #第二组数据
即使两组数据有极大差异,但是直接加总每个元素与平均值的距离会造成失真,原因是每个元素的偏差距离有正与负,在加总时正与负之间抵消了,所以正式定义方差时,是先将每个元素与平均值的距离做平方,然后加总,再除以数据的数量。下列是计算方程的步骤:
(1)计算数据的平均值。
(2)计算每个元素与平均值的距离,同时取平方,最后加总。
(3)方差最后计算公式如下:方差=
若是使用符号,可以得到下列方差公式:
方差
销售数据,计算方差:
x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
mean = sum(x) / len(x)
# 计算变异数
var = 0
for v in x:
var += ((v - mean)**2)
var = var / len(x)
print("变异数 : ", var)
运行结果:
[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
变异数 : 823.49
[Done] exited with code=0 in 1.156 seconds
使用numpy模块的var()方法,建立销售数据的方差。
import numpy as np
x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print("变异数 : ",np.var(x))
运行结果:
[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
变异数 : 823.49
[Done] exited with code=0 in 3.03 seconds
标准偏差
标准偏差的英文是Standard Deviation,编写是SD,计算方差后,将方差的结果开根号,可以获得平均距离,所获得的平均距离就是标准偏差。
标准偏差
计算标准偏差。
x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
mean = sum(x) / len(x)
# 计算变异数
var = 0
for v in x:
var += ((v - mean)**2)
sd = (var / len(x))**0.5
print("标准偏差 : {0:6.2f}".format(sd))
运行结果如下:
[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
标准偏差 : 28.70
[Done] exited with code=0 in 0.758 seconds
在numpy模块有std()方法,可以直接建立标准偏差。
import numpy as np
x = [66, 58, 25, 78, 58, 15, 120, 39, 82, 50]
print("标准偏差 : {0:6.2f}".format(np.std(x)))
运行结果如下:
[Running] python -u "c:\Users\a-xiaobodou\OneDrive - Microsoft\Projects\tempCodeRunnerFile.py"
标准偏差 : 28.70
[Done] exited with code=0 in 2.563 seconds
符号运算规则与验证
活用符号
省略