R语言描述性统计
在做数据分析时,一般先会对数据进行描述性统计分析,以便于描述该数据的各种特征及其所代表的总体的特征。描述性统计分析包括对数据的集中趋势、离散程度以及分布进行分析。
集中趋势统计量: 均值(Mean)、中位数(Median)、众数(Mode)、百分位数
离散趋势统计量:标准差(sd)、方差(var)、极差(range)、变异系数(CV)、标准误、样本校正平方和(CSS)、样本未校正平方和(USS)
分布情况统计量:偏度、峰度
统计量 | 函数 |
---|---|
均值 | mean(x, …);mean(x, trim = 0, na.rm = FALSE, …) |
中位数 | median(x, …);median(x, trim = 0, na.rm = FALSE, …) |
频数 | table(x, …) |
众数 | which.max(table(x)) |
五数/描述统计 | summary(x, …);fivenum(x, …) |
方差 | var(x, na.rm = FALSE) |
标准差 | sd(x, na.rm = FALSE) |
偏度 | 需要先加载moments包或fBasic包,再用函数skewness() |
峰度 | 需要先加载moments包或fBasic |