数据管理

最新推荐文章于 2024-08-06 12:19:47 发布

Intelligebce

最新推荐文章于 2024-08-06 12:19:47 发布

阅读量420

点赞数

分类专栏： R

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Intelligebce/article/details/80256817

版权

R 专栏收录该内容

15 篇文章 3 订阅

订阅专栏

一、数据集合并

1、使用merge函数

total<-merge(dataframeA,dataframeB,by="")

2、使用cbind，rbind函数（合并矩阵或者数据框）

二、数据集取子集

选入(保留)变量：

Vars<-c(.......)

mydata<-dataframe_name[Vars]

剔除（丢弃）变量

1.使用%in%

myvars<- names(leadership) %in% c("q1","q2")

newdata<- leadership[!myvars]

2.使用索引

newdata<- leadership[c(-8,-9)]

3.赋值

将要去除的变量列赋值为NULL即可去除变量

4.选入观测

A.通过索引或者条件表达式

newdata<- leadership[1:3,]

newdata<-leadership[ leadership$gender=="M"7leadership$age>30]

三、使用subset函数（可以选择变量和观测）

subset(数据集，条件表达式，select)

newdata<- subset( leadership, age>=35|age<24, select=c(q1,q2,q3,q4))

四、随机抽样

mysample<- leadership[ sample(1:nrow(leadership), 3, replace=FALSE), ]

五、使用SQL语句操作数据框

install.packages("sqldf")

newdf<-sqldf("SQL语句",row.names=TRUE)

newdf<-sqldf("select * from mtcars where carb=1 oeder by mpg",roe.names=TRUE)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。