概述
第二部分关注的是用于获取数据基本信息的图形技术和统计方法。
第6 章描述了可视化单个变量分布的方法。对于类别型变量,有条形图、饼图以及比较新的扇形图。对于数值型变量,有直方图、密度图、箱线图、点图和不那么著名的小提琴图(violin plot)。每类图形对于理解单个变量的分布都是有益的。
第7 章描述了用于概述单变量和双变量间关系的统计方法。这一章使用了一个完整的数据
集,以数值型数据的描述性统计分析开始,研究了感兴趣的子集。接下来,它描述了用于概述类别型数据的频数分布表和列联表。这一章以那些用于理解两个变量之间关系的方法作结,包括二元相关关系的探索、卡方检验、t 检验,以及非参数方法。
图形绘制
条形图
数据已包含在随vcd包分发的Arthritis数据框中。由于vcd包并没用包括在R的默认安装中,请确保在第一次使用之前先下载并安装它(install. packages(“vcd”))。
counts <- table(Arthritis$Improved)
barplot(counts, main="", xlab="",)
counts <- table(Arthritis$Improved)
barplot(counts, horiz=TRUE) #水平
counts <- <- table(Arthritis I m p r o v e d , A r t h r i t i s Improved, Arthritis