交集intersect、并集union、差集setdiff、判断相同setequal
在使用R语言进行生物信息数据分析的过程中,需要经常比较不同集合之间元素的共性和差异,所以需要使用到交集、并集、找不同、判断相同等操作。
交集:intersect
两个向量的交集,集合可以是数字、字符串等
# 两个数值向量取交集
intersect(x=1:4, y = 2:6)
# [1] 2 3 4
# 两个字符向量取交集
intersect(x=letters[1:4], y = letters[2:6])
# [1] "b" "c" "d"
# 混合向量
intersect(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))
[1] "a" "4"
并集:union
求两个向量的并集,集合可以是任何数值类型
# 两个数值向量取并集
union(x=1:4, y = 2:6)
# [1] 1 2 3 4 5 6
# 两个字符向量取并集
union(x=letters[1:4], y = letters[2:6])
# [1] "a" "b" "c" "d" "e" "f"
# 混合向量
union(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))
[1] "a" "b" "c" "4" "2" "3"
差集:setdiff
求向量x与向量y中不同的元素(只取x中不同的元素,即存在于向量x减去向量x与向量y的交集)
setdiff(x, y)
x = 1:4
y = 2:6
# 找x中不同于y的元素
setdiff(x, y)
# [1] 1
# 找y中不同于x的元素
setdiff(y, x)
# [1] 5 6
判断相同:setequal
x = 1:4
y = 2:6
# 判断x与y是否相同,结果为假
setequal(x, y)
# [1] FALSE
# 找y与x是否相同,结果为假
setequal(y, x)
# [1] FALSE
# 只有完全相同的才返回TRUE
y = 1:4
setequal(x, y)
# [1] TRUE
案例
# 两个字符向量
treeleaf
treeotu
length(treeleaf)
length(treeotu)
# 取交集
intersect_res
length(intersect_res)
#取并集
union_res
length(union_res)
# 取差集
diff1
length(diff1)
diff1
# 判断相同
equals_res
equals_res