【应用多元统计分析】--多元数据的描述和展示(R语言)

一元随机变量

 

我们用协方差来刻画两个变量的相关关系,这里指的是线性相关关系。

对于一元随机变量的可视化最简单的就是散点图,大致可以看出X和Y之间的相关关系。如果想更好的看X、Y之间的相关关系,可以画二维的散点图。

 

总结:

均值描述随机变量的中心

方差描述随机变量的离散程度

协方差和相关系数来描述变量之间的线性关系

用散点图去描述两个变量的相关关系 

多元数据的描述和展示

均值向量

代码 

round(colMeans(iris[,1:4]),2)#求均值向量
#这里round函数是取有效数字,2代表保留两位有效数字

 

协方差矩阵

描述数据离散程度以及了解这个多元数据变量与变量之间的相关性。

 

 

代码

S<-round(cov(iris[,1:4]),2)#求协方差矩阵
S

 

总体相关系数矩阵

相关系数就是对协方差的标准化 

代码

R<-round(cor(iris[,1:4]),2)#总体相关系数矩阵
R

可视化(R代码描述)

两两散点图

pairs(iris[1:4],main="Scatterplot Matrix for Fisher's Iris Data")

比较两两之间的线性关系 

# 创建颜色向量
colors <- c("red", "green", "blue")

# 设置物种对应的颜色向量
species <- iris$Species
species_colors <- colors[as.numeric(species)]

# 绘制配对散点图
pairs(iris[, 1:4], main = "Scatterplot Matrix for Fisher's Iris Data", col = species_colors)

加上颜色方便比较。

 

三维散点图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值