本文使用的数据集为ggplot2包自带的diamonds数据集,其包含了约54000颗钻石的价格和质量的信息。这组数据涵盖了反映钻石质量的四个“C”——克拉重量(carat)、切工(cut)、颜色(color)和净度(clarity),以及五个物理指标——深度(depth)、钻石宽度(table)、x、y、z。如下图:
本文使用的另一个数据集是原始数据的一个容量为100的随机样本
set.seed(1410) #使样本可重复
dsmall<-diamonds[sample(nrow(diamonds),100),]
1 基本用法
格式:qplot(x,y,data=data1)
例:qplot(carat,price,data=diamonds)
qplot(log(carat),log(price),data=diamonds)
颜色、大小、形状和其他属性
qplot(carat,price,data=dsmall,colour=color)
qplot(carat,price,data=dsmall,shape=cut)
qplot(carat,price,data=diamonds,aplha=I(1/100))
2 几何对象geom
geom=”point” 可以绘制散点图
geom=”smooth” 将拟合一条平滑曲线,并将曲线和标准误展现在图中
geom=”boxplot” 可以绘制箱线胡须图,可以概括一系列点的分布情况
geom=”path” 和geom=”line” 可以在数据点之间绘制连线。线条图只能创建从左到右的连线,而路径图则可以是任意方向。
对于一维的分布,几何对象的选择是由变量的类型指定的:
对于连续变量,geom=”histogram”绘制直方图,geom=”freqploy”绘制频率多边形,geom=”density”绘制密度曲线。
对于离散变量,geom=”bar”绘制条形图。
例:向图中添加平滑曲线
qplot(carat,price,data=dsmall,geom=c("point","smooth"))