在机器学习(和数学)中通常存在三中我们感兴趣的值:
- 均值(Mean) - 平均值
- 中值(Median) - 中点值,又称中位数
- 众数(Mode) - 最常见的值
例如:我们已经登记了 13 辆车的速度:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
使用numpy模块计算均值:
import numpy as np
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
mean=np.mean(speed)
print(mean)
print(round(mean,2))#保留两位小数
89.76923076923077
89.77#这里经过了四舍五入
使用numpy模块计算中位数:
import numpy as np
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
median=np.median(speed)
print(median)
87.0
请使用 SciPy mode() 方法查找出现次数最多的数字:
from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Mode=stats.mode(speed,keepdims=False)
print(Mode)
ModeResult(mode=86, count=3)
#即众数是3,出现了3次