均值:
受到极端值影响大(通过去掉极端值)
首尾去掉5%
a<-runif(20)
mean(a,trim = 0.05)
a<-round(runif(20,0,10)) 取整数随机 round:取整
几何平均数:适用于原始数据不对称
中位数:
递增排序后的数据中,不受极端值影响
众数
names(x)[x==max(x)]
方差
var(a) 样本的方差:n-1
总结五数
最小 第一四分位 中位 第三四分位 最大
fivenum(a)
boxplot(a) 箱线图
茎叶图看频数
stem(a)
频数直方图
hist(a)
hist(a,breaks = 50) 画50个直方图
关系分析
相关关系:
- 非严格
- 不确定线性关系
具有不确定性,有一定的随机性,但遵循一定的规律
步骤:
1、判断现象有无关系
2、关系密切程度、方向
3、相关关系的数学表达式
相关分析:两个以上的变量
回归分析:某一个变量与其他变量数据的变动关系;由回归分析求出关系式,称为回归模型。自变量+因变量</