Python中统计变量的单变量分布
一个变量的分布称为单变量分布,它们可以分为离散分布、连续分布。
1、分布的特性描述
1.1、分布中心
当我们有一个来自分布的数据样本,我们可以采用不同的参数来描述分布中心,数据可以用两种方式来进行评估。
(1)用它们的值;
(2)用它们的秩;
1.1.1、均值
默认来说,当我们讲到均值的时候,我们指的是算术均值,我们可以使用命令np.mean来找到数组x的均值,在现实生活中的数据通常包含缺失值,在许多情况下,缺失值用nan来代替(nan代表“非数字”),对于包括nan的数组的统计,numpy具有许多处理nan的函数。
import numpy as np
x=np.arange(10)
np.mean(x)
1.1.2、中位数
中位数是当数据