数据集取子集

  • 选入(保留)变量
#以下几种方式获取子集的结果是相同的
> newdata  <- leadership[,c(6:9)]        #获取列下标为6-9 的数据包含6和9
> View(newdata)

> myvars1 <- c("q1","q2","q3","q4","q5") #获取列为q1...的数据
> newdata1 <- leadership[myvars]
> View(newdata1)

> myvars2 <- paste("q",1:5,sep="")       #paste函数
> newdata <- leadership[myvars2]
> newdata2 <- leadership[myvars2]
> View(newdata2)

 

  • 剔除(丢弃)变量

想要排除不需要的变量有几种方式

1、通过负号“-”和位置来筛选

> newdata <- leadership[-8,-9]#通过位置前加负号“-”来和剔除
> View(newdata)

2、通过取反的方式

    a、返回一个逻辑型的变量,剔除的变量用TRUE表示

    b、使用取反

#剔除变量“q3,q4”
x <- names(leadership) %in% c("q3","q4") 
newdata1 <- leadership[!x]
#代码分析
# 1、names生成leadership变量名的字符型向量 c("a","b","q3","q4"...,"n")
# 2、%in% c("q3","q4") 判断q3、q4是否在变量名里面,这一行整句返回逻辑型向量,q3,q4位置为TRUE,其他为FALSE ,C("FLASE","FLASE","TRUE","TRUE",...,"FALSE")
# 3、运算符号" !”将逻辑值反转,向量FLASE 全部成 TRUE,TRUE全部成FALSE
# 4、newdata1 <-leadership[c("TRUE","TRUE","FALSE","FLASE",..."TRUE")]取出TRUE的值,这样q3、q4就被排除了。

#剔除变量“q3”
y <-names(leadership) %in% "q3"
newdata2 <- leadership[!y]

 

[参考]

根据列名或者行名如何提取整列或者整行数据 R (转载总结)_ccpacer_新浪博客  

R读取大数据--仅读取指定列 - CSDN博客 

R语言为数据框添加列名或行名 - 龙种人 - 博客园  

 

转载于:https://my.oschina.net/u/1785519/blog/1563056

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值