R语言入门
mean()--计算平均值
sd()--计算标准差
cor()--计算相关系数
plot()--绘制散点图
library()--引用包(包名不加双引号)
help.start()--打开浏览器,显示全部帮助文档
demo()--列出所有可用演示
help("foo")或?foo--查看函数foo的帮助(引号可省略)
??foo--以foo为关键词搜索本地帮助文档
example("foo")--函数foo的使用示例(引号可省略)
apropos("foo",mode="function")--列出名称中含有foo的所有可用函数
data()--列出当前已加载包中所含的所有可用示例数据集
getwd()--显示当前工作目录
setwd("mydirectory")--修改当前工作目录为mydirectory
ls()--列出当前工作目录中的对象
rm()--移除删除一个或多个对象
q()--退出R,并询问是否保存工作空间
history()--查看之前保存的命令
list.files()--查看当前目录下文件
source("test")--在当前会话中执行1个脚本
sink("filename")--输出重定向到文件filename中
install.packages(" ")--安装R包
.libpath()--显示包所在位置
library()--显示已加载的包(括号里什么都不写)
数据类型
c(...)--产生自定义向量
from:to--产生一个序列
seq()--产生一个等差向量序列 格式:seq(from=n,to=m,by=k,len=w) (首位,末位,公差,个数)(to和len不能同时使用)
rep()--重复一个对象 格式1:rep(x,times) 格式2:rep(x,each=n)
rnorm()--随机产生正态分布向量 格式:rnorm(个数,均值,方差)
sqrt(x)--向量x中每一个元素开方
crossprod(x,x)--内积 tcrossprod(x,x)--外积
matrix(data,c(nrow,ncol),byrow=T/F) matrix(data,nrow=,ncol=,byrow=T/F)--创建一个矩阵
其他创建矩阵格式:rbind(c( ,),c(,)) array(rep( : ,each= ),dim=c( , )) data.frame(a=c( , ),b=c( , ))
t(y)--矩阵y转置
cbind()--横向合并矩阵 rbind()--纵向合并矩阵
as.vector()--将矩阵转化为向量
dim()、nrow()和ncol()--返回矩阵维度
rowSums()--各行求和 rowMeans()--各行均值
colSums()--各列求和 colMeans()--各列均值
det()--计算行列式
x<-data.frame(col1,col2,col3,...)--创建数据框
factor()--以一个整数向量形式存储类別值
nchar(string)--求字符串长度
paste(str1,str2,sep=" ")--字符串合并
strsplit(string,sep)--字符串分割
substr(string,start,stop)--读取和替换字符串
chartr(old,new,string)--字符串替换
用于数据处理和转换的常用函数:
数据准备
edit(data)--通过R上内建的编辑器输入数据
read.table()--从带分隔符文本文件导入数据
write.table()--导出文本文件
数据可视化
set.seed()--设定生成随机数的种子
rnorm()--正态分布随机数
plot()--绘制散点图线形图等 type="p"点 type="l"线 type="b"下画线 lwd=n--线条变宽为n倍
pie()--画饼图
barplot()--画条形图
hist()--画直方图
boxplot()--箱线图
高水平绘图命令ggplot2暂不整理
数据探索
is.na(x)--判断x是否为缺失值(是返回TRUE,否返回FALSE)
complete.cases(x)--判断x是完整的函数
summary函数显示每个变量的缺失值数量
数据变换
unique()--数据重复检测函数,只对向量适用
duplicated()--数据重复检测函数,向量数据框等适用(返回TURE或FALSE)
scale()--数据标准化
get.test()--抽样函数,随机分组
transform()--为原数据框增加新的列变量
within()--与transform作用一致,适用更多情况
stack()--数据框长宽格式转换
unstack()--列表长宽格式转换
数据汇集函数:aggregate,sqldf,group_by,summarize