R-统计及可视化学习笔记(描述性统计量)

参考:生物信息学最佳实践-基础篇

 

目录

数据获取

一、箱线图

二、直方图

三、累积分布函数图


 


数据获取

使用summary()函数得到一个data frame的描述性统计量,以R中内置的Edgar Anderson's Iris Data进行展示。

# 查看常用的描述统计量
summary(iris)

 


 

一、箱线图

# 使用箱线图展示某一列数据的分布情况
boxplot(iris$Sepal.Length)

箱线图怎样分析

箱线图(盒图、箱盒图)

如上图所示,箱线图由五个数值点构成,分别是最小观察值(下边缘),25%分位数(Q1),中位数,75%分位数(Q3),最大观察值(上边缘)

箱线图里的极大值(上边缘值)并非最大值,极小值(下边缘值)也并非最小值。

如果数据存在离群点(异常值),超出最大或最小观察值,此时离群点将以“圆点”形式进行展示。

 

小结

(1)箱线图是针对连续型变量的,解读时应重点关注平均水平、波动程序和异常值。

(2)当箱子被压得很扁,或有很多异常情况时,试着做对数变换。

(3)当只有一个连续型变量时,并不适合画箱线图,更常选择直方图。

(4)箱线图最有效的使用途径是做比较,配合一个或多个定性数据,画分组箱线图。

 


 

二、直方图

# 使用直方图展示某一列数据的分布情况
hist(iris$Sepal.Length)


 

三、累积分布函数图

# 绘制简单的累积分布函数图展示某一列数据分布情况
plot(ecdf(iris$Sepal.Length))

 

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值