好记性不如烂笔头
数据描述函数
function | Package | 用途 | 说明 |
---|---|---|---|
summary | base | 数据描述 | 最小最大值、四分位数、中位数、均值,因子向量及逻辑向量的频数统计 |
describe | Hmisc | 数据描述 | 变量和观测值数,缺失值、唯一值数目,均值、四分位数,最大最小五个值 |
describe2 | psych | 数据描述 | 非缺失值数量,平均数、中位数、标准差、截尾均值、值域、偏度、峰度等 |
stat.desc | pastecs | 数据描述 | 空值、缺失值数量,最小最大值、值域、和,中位数、平均数、平均数的标准误、平均数95%置信区间、方差、标准差、变异系数、正太分布统计量等 |
aggregate | stats | 分组数据描述 | 可返回数据的平均数、标准差等单返回值函数的分组描述 |
by | base | 分组数据描述 | 可按照自定义统计项列表的返回数据的分组描述 |
summaryBy | doBy | 分组数据描述 | 类似by,输出形式不同 |
describeBy | psych | 分组数据描述 | 可分组描述数据的describe函数 |
table | base | 列联表/频数表 | 生成表格 |
xtabs | stats | 列联表/频数表 | 生成表格 |
prop.table | base | 列联表/频数表 | 依维度统计列联表/频数表数据的百分比 |
margin.table | base | 列联表/频数表 | 依维度统计列联表/频数表数据和——降维 |
addmargins | stats | 列联表/频数表 | 依维度添加表格求和项 |
CrossTable | gmodels | 列联表/频数表 | table+prop.table+addmargins功能,计算期望和残差,卡方、Fisher、McNemar独立性检验等 |
ftable | stats | 列联表/频数表 | 扁平直观的多维度表格 |
相关性检验
function | Package | 用途 | 说明 |
---|---|---|---|
chisq.test | stats | 独立性检验 | 二维表卡方独立性检验 |
fisher.test | stats | 独立性检验 | 行数或列数>2的二位列联表(非2*2),Fisher精确检验 |
mentelhaen.test | stats | 独立性检验 | Corchran-Mantel-Haenszel卡方检验,两个变量在第三个变量每一层中的独立性检验 |
绘图初阶
散点图
plot
- 包:graphics
plot(mtcars$wt,mtcars$mpg)
scatterplot
- 包:car
- formula(x~y|z)控制纵轴横轴xy和因子向量z
- 可添加拟合曲线,边界箱线图 (boxplots) ,置信椭圆等
- R version 3.3.2不可用
scatterplot(mpg~wt|cyl,data=mtcars,boxplot="xy")
pairs
- 包:graphics
- 绘制散点图矩阵组
pairs(~mpg+wt+disp, data=mtcars)
smoothScatter
- 包:graphics
- 绘制高密度散点图
with(mtcars,smoothScatter(mpg,wt))
hexbin
- 包:hexbin
- 绘制蜂箱高密度散点图
- R version 3.3.2不可用
scatterplot3d
- 包:scatterplot3d
- R version 3.3.2不可用
with(mtcars,smoothScatter(mpg,wt))
折线图
待续