R语言学习笔记【7】数据库管理

STA3050 Lec7笔记

选取

> d1[d1$age<25,]

分类以及排序

order() 返回向量排序
> order(d1$age) # order of age in d1 
[1] 5 3 4 6 1 8 11 10 7 2 9
> d1[order(d1$age, d1$acc_no),] #age是第一关键词,acc_no是第二关键词

> rank(d1$age)
[1] 4.5 10.0 2.0 3.0 1.0 4.5 9.0 6.5 11.0 8.0 6.5

匹配
x %in% y returns a logical vector indicating the elements in x which are also available in y.

e.g.	
> 1:8 %in% 5:10
[1] FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE

!( x %in% y ) will return a logical vector whose elements in x but not in y.

> !(1:8 %in% 5:10)
[1] TRUE TRUE TRUE TRUE FALSE FALSE FALSE FALSE

筛选共有的并组合

> merge(d1,d2,by="name")#默认all=F
name acc_no sex age save check card loan
1 AliceChan  87441 f 23 5463  436  1 1 
2 Boris Lee  96205 m 30 23520 3464 1 0 
3 David Wong 41692 m 21 23430 546  1 1

如果不筛选直接组合所有的

> (d3<-merge(d1,d2,by="name",all=T))

在这里插入图片描述

查找重复

> d4[duplicated(d4$name),]

查找非重复

> (d5<-d4[!duplicated(d4$name),])

划分字符串

name<-strsplit(name," ")

字母大写

(last<-toupper(name[,2]))

替换函数

d3<-replace(d,d>2,NA) d: 替换前,d>2: 条件,NA: 替换后
# replace all values > 2 to NA

等距划分函数

f<-cut(d,breaks=c(-Inf,-2:2,Inf),labels=c("A","B","C","D","E","F"))
#把d按照(‐∞, ‐2], (‐2, ‐1], (‐1, 0], (0, 1], (1, 2], (2, ∞] 分为A, B, C, D, E, F
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值