小白一枚,最近开始课题要求,正在尝试用R处理数据,在这个过程中学习了一些命令,记录一下。
x<-read.csv("F:/table.csv",sep=",") ## 读取数据
v2<-x$v1!=0 ###新建变量:将x中变量v1不等于零的编码为0,大于或小于0的编码为1
a<-sum(v2)/3163 ###计算v1不为0的个数占总数的比例(即v2求和处以总数)
xv1<-x[v2,] ###保留v1中不等于零的案例
v3<-x$v1>0
meanv1<-mean(x[v3,]$v1) ###求v1中大于零的平均数
tapply(v2,x$industry,sum) #######分行业看v2的个数
小结:
不等于:
!=
read.csv()
data.frame(c(...),c(...))
x[row,col]
tapply(v1,v2,FUN)
with(y, addmargins(table(gender, province)))##可以做出一个gender和province的交叉表