数据管理

一、数据集合并

1、使用merge函数

               total<-merge(dataframeA,dataframeB,by="")

2、使用cbind,rbind函数(合并矩阵或者数据框)

二、数据集取子集

选入(保留)变量:

              Vars<-c(.......)

              mydata<-dataframe_name[Vars]

剔除(丢弃)变量

1.使用%in%

             myvars<- names(leadership)  %in%  c("q1","q2")

             newdata<- leadership[!myvars]

2.使用索引

            newdata<- leadership[c(-8,-9)]

3.赋值

           将要去除的变量列赋值为NULL即可去除变量

4.选入观测

A.通过索引或者条件表达式

           newdata<- leadership[1:3,]

           newdata<-leadership[ leadership$gender=="M"7leadership$age>30]

三、使用subset函数(可以选择变量和观测)

           subset(数据集,条件表达式,select)

           newdata<- subset(  leadership,  age>=35|age<24,   select=c(q1,q2,q3,q4))

四、随机抽样

           mysample<- leadership[ sample(1:nrow(leadership), 3, replace=FALSE),  ]

五、使用SQL语句操作数据框

          install.packages("sqldf")

          newdf<-sqldf("SQL语句",row.names=TRUE)

          newdf<-sqldf("select * from mtcars where carb=1 oeder by mpg",roe.names=TRUE)










评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值