python 统计学基础1:描述性统计
一、频数
1、频数:一组定量数据中,每一个数值发生的次数即为频数。
2、频率:将每一个数值发生的次数除以样本总数量,即频率
二、数据的位置(平均数、中位数、众数、百分位数)
data 在下面代表样本数据集-----------------------------------------------------
2.1、求平均数:(Sample Mena)
data.mean()
2.2、求中位数(Median):即使样本中至少50%的数据大于等于md,同时至少50%的数据小于等于md,它是一个很好的度量数据中心位置的方法。
data.median()
2.3、众数(Mode): 众数是一组数据中出现次数最多的数值,也是常见的度量数据中心位置的指标。同中位数一样,众数不易受极端值的影响。
data.mode()
2.4、百分位数: 第n百分分位数即为使得至少(100-n)%的观测值大于等于该数、至少n%的观测值小于等于该数的一个数值。通常将第25百分位数与中位数、第75百分位数取出来组成四分位数,分别叫做第一四分位数(或下四分位数),第二四分位数、第三四分位数(或上四分位数)。
求上四分位数和下四分位数:quantile( )
data.quantile(i)