无论在何时分析数据,第一件要做的事情就是观察它。对于每个变量,哪些值是最常见 的?值域是大是小?是否有不寻常的观测?R中提供了丰富的数据可视化函数。这节课将展开对R中条形图,饼图,扇形图,直方图等图的了解。
1.条形图:通过垂直的或水平的条形展示了类别型变量的分布(频数)。函数barplot()的最简 单用法是:barplot(height) ,其中height是一个向量或一个矩阵。
代码barplot(c(1,2,4,2,6,4,3,5)) 显示出如下图形:(但如果加上horiz=TRUE,将显示横向条形图)
堆砌条形图:如果height是一个矩阵而不是一个向量,则绘图结果将是一幅堆砌条形图或分组条形图
上图为堆砌条形图,代码counts<-table(Arthritis$Improved,Arthritis$Treatment,beside=TRUE)将显示为分组条形图
条形图并不一定要基于计数数据或频率数据。你可以使用数据整合函数并将结果传递给 barplot()函数,来创建表示均值、中位数、标准差等的条形图
2.饼图:饼图可由以下函数创建: pie(x, labels) 其中x是一个非负数值向量,表示每个扇形的面积,而labels则是表示各扇形标签的字符型向量。
par(mfrow=c(2,2))
x <- c(10,12,4,16,8)
lab<-c("US","UK","Australia","Germary","France")
pie(x,lab,main = "Simple Pie Chart")
上述代码将表现出如下饼状图
rainbow() 函数定义了各扇形的颜色
3D饼图:绘制3D饼图之前要先下载安装plotrix,install.packages("plotrix"),library(plotrix)
代码 pie3D(x,explode = 0.1,main="3D pie Chart") 显示出下面3D饼图
代码fan.plot(x,labels = lab,main = "Fan plot") 显示出下面扇形图
3.直方图
直方图通过在x轴上将值域分割为一定数量的组,在y轴上显示相应值的频数,展示了连续型变量的分布。可以使用如下函数创建直方图: hist(x) 其中的x是一个由数据值组成的数值向量。
使用lines(density(x),col="red",lwd=2)可以画出直方图的轴须线,反映整个数值呈现的频率变化情况
4.核密度图:核密度估计是用于估计随机变 量概率密度函数的一种非参数方法。
sm包中的sm.density.compare()函数可向图形叠加两组或更多的核密度图。使用格式为: sm.density.compare(x, factor) 其中的x是一个数值型向量,factor是一个分组变量。在第一次使用sm包之前要安装它。
5.箱线图:箱线图(又称盒须图)通过绘制连续型变量的五数总括,即最小值、下四分位数(第25百分 位数)、中位数(第50百分位数)、上四分位数(第75百分位数)以及最大值,描述了连续型变量 的分布。
代码boxplot(mtcars$mpg,main="Box Plot",ylab="Mile per gallon") 将显示如下图形
两个跟R有关的网站
http://biotrainee.com/jmzeng/markdown/basic-plot-R.html
http://biotrainee.com/jmzeng/markdown/ggplot-in-R.html