R语言中两表连接且输出不重复数据

最新推荐文章于 2024-06-09 20:33:24 发布

Watch_dou

最新推荐文章于 2024-06-09 20:33:24 发布

阅读量3k

点赞数 2

分类专栏： get小技巧

本文链接：https://blog.csdn.net/u012111465/article/details/75298988

版权

在项目中，面对一个整理后的结果表，仅包含会员电话且唯一，而另一张member表包含重复的会员ID和电话信息。目标是使用R语言的数据.table包和sqldf包，通过SQL语句连接两表，保持结果表行数不变，增加b列信息。

摘要由CSDN通过智能技术生成

在做项目中遇到了如此问题，其中整理的结果表中没有会员ID信息，只有会员电话号码信息，且每一行为唯一一个会员。另外一张member表中包含会员ID以及会员电话信息，但是这张表有重复的会员信息，也就是说一个会员在member表中多次出现，memeber表比整理的表要大很多。

说明：

1.在项目过程中，数据量较大，用到的是data.table包，需要用到SQL中的语句减少代码量，因此需要sqldf包。

2.以下例子中xx中的a1在yy中都有对应的值。

3.yy中的a1与b是一一对应的关系，不存在同一个a1值对应不同的b值。

4.此程序的目的是，用yy表与xx表匹配，也就是最终的结果应该是在xx的基础上增加b这一列的信息，数据集xx的行数不变。

go on

> library(data.table)
> library(sqldf)
> xx <- data.table(a1=1:6,c=c(8,5,8,6,23,7),d=c('adf','af','sdf','utr','af','ruti'))

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Watch_dou

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

R语言使用table函数构建二维列联表、使用chisq.test函数进行卡方检验、检验两个分类变量是否独立

statistics+insight+vista+power

04-15

836

R语言使用table函数构建二维列联表、使用chisq.test函数进行卡方检验、检验两个分类变量是否独立

R语言数据表匹配和拼接-merge函数

gavin_cdc的博客

05-15

1万+

R中的merge函数类似于Excel中的Vlookup，可以实现对两个数据表进行匹配和拼接的功能。 merge(x, y, by = intersect(names(x), names(y)), by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all, sort = TRUE, suffixes = c(".x",".y"), ...

参与评论您还未登录，请先登录后发表或查看评论

R语言中实现表的链接-merge函数

lijinxiu123的博客

03-17

5773

R语言中实现表的链接 R中merge函数

R 语言的表格合并（实际运用）

qq_24176021的博客

02-07

1万+

R语言的表格合并（实际运用）是这样的，工作中我需要处理两个表格。要把两个表格合并，展示下两个表格的部分数据和格式。我需要做的是把两个表合并，变成3列，日期，男，女。需求就是这个，观察下，这边有的日期，另一边可能没有。然后我就手工合并，因为数据不是很多，但也不是很少。手动了两行，我发现不行，不但效率低，而且准确率也不可信。就想到之前工作学过R语言，就用R做吧。 R语言处理表格数据还是很牛逼哄哄的。（强烈推荐哦）首先引入所需要的的R包 pacman::p_load(dplyr, magritt

R语言中dplyr包的多表连接

最新发布

2301_77727857的博客

06-09

528

在数据分析中，处理多个数据表是常见的需求。R语言中，dplyr包提供了丰富的连接（join）函数来实现多表连接操作。本文将解释R语言中的各种连接类型，包括内连接、外连接、左连接、右连接、半连接和反连接，并给出相应的示例代码。

R语言系列：生成数据

weixin_30243533的博客

05-20

399

生成规则数据 1、使用“:“，如x=1:10，注意该方法既可以递增也可以递减，如y=10:1 2、seq，有两种用法：①seq(起点，终点，步长); ②seq(length=9, from=1, to=5) seq还有一种简写：seq(x) #相当于1:length(x)，但当length(x)为0时，返回integer(0) 3、c(1,2,8) 4、使用sc...

r语言获取html上数据,R语言数据读取以及数据保存方式

weixin_36354744的博客

06-02

4026

一、R语言读取文本文件：1、文件目录操作：getwd() : 返回当前工作目录setwd("d:/data") 更改工作目录2、常用的读取指令readread.table() : 读取文本文件read.csv(): 读取csv文件如果出现缺失值，read.table()会报错，read.csv()读取时会自动在缺失的位置填补NA3、灵活的读取指令scan() :4、读取固定宽度格式的文件：read...

R语言-数据转换

weixin_51077152的博客

09-02

1万+

常见的数据类型：向量，矩阵，数据框，列表 1. 用is和as函数 is相关函数：判断数据类型 > methods(is) [1] is.Alignment is.array is.atomic is.Border is.call [6] is.CellBlock is.CellProtection is.CellS.

r语言用行名称提取数据框信息显示na_学会这些R语言技巧至少可以节省半年时间...

weixin_36072709的博客

01-17

3439

ubuntu备忘定期清空回收站扩增子数据牢记r ubuntu 相关技巧和备忘待解决问题1：phyloseq有一篇文章案例使用输入和输出文件相同的文件名，无法执行待解决问题2：待解决问题3：样品分组文件太长了，导致提取出来数据存在NA值错误牢记：for循环错误一定要检查这个地方错误牢记：正确提取行名修改注释文件的门类标签为标准格式phyloseq格式的文件导出为txt合并phyloseq：默认去除为...

【R语言学习笔记】二、R语言数据结构之向量

RealCoder的博客

06-10

2798

向量是R中最为基本的类型一个向量中元素的类型必须相同，包括数值型、逻辑型、字符型、复数型。注意:单个向量中的数据必须拥有相同的类型或模式（数值型、字符型或逻辑型）。一、数值型向量建立向量的方法(函数)： seq() 或 “:” 若向量(序列)具有较为简单的规 seq(from , to, by, length.out, along.with) #生成从from到to的向量，by为步长，length.out为生成元素的长度，along.with取赋予变量的长度为元素的个数； re.

R语言--合并指定列的两个表数据

qq_44390640的博客

08-12

1万+

A<-(read.csv("f:\\TEST\\TDD.csv")) B<-(read.csv("f:\\TEST\\ECI.csv")) data1<-data.frame(A[c('Date_ID','erbs','eutrancellTDD')]) ####合并A表指定字段 data2<-data.frame(B[c('ECI','CELL')]) ####合并B...

R语言与统计基础二频数表与列联表

我爱小小

11-24

5252

分析数据时，需要通过一些工具，把数据转换成，我们能直观理解处理的数据，频数表和列联表比较容易理解；生成频数表方法函数描述 table 使用N个类别型变量（因子）创建一个N维列联表，向量是列变量 xtabs 根据公式和一个矩阵或数据框创建一个N维列联表,类似excel公式处理 prop.tables 依margins 定义的边际列表将表中条目表示为分数形...

两张表的数据对比

thedarkclouds的博客

06-21

3698

第一种方案：select * from tb_a A where NOT EXISTS (select 1 from tb_b B where A.ID = B.ID); 第二种方案：select * from tb_a A where A.ID NOT IN(select B.ID from tb_b B );...

R语言生成各种数据

weixin_30393907的博客

10-14

1498

R语言生成各种数据 1.生成实数，起始值，末值，间隔 > seq(1, 5, 0.5)[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0> seq(length=9, from=1, to=5)[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.02.使用键盘生成数字> z <- scan()1: 1.0 1.5 2.0...

R中双表操作学习[转载]

weixin_33923762的博客

12-27

177

转自:https://www.jianshu.com/p/a7af4f6e50c3 1.原始数据以上是原有的一个，再生成一个新的： > gene_exp_tidy2 <- data.frame(GeneId = rep("gene5", times = 3),sample_name = paste("sample", 1:3, sep = ""), expressi...

机器学习之R语言基础篇2（列联表大致内容）

鲁鲁酱的博客

11-15

6914

今天呢，我们接着昨天的内容继续哈~~ 今天是鲁鲁酱第二次发博客，哈哈，木有昨天那样紧张了-_-，下面开始咯~ 列联表的创建掌握以下三种方式即可> t1=data.frame(x1=c(1,2,3,4,5,6,7),x2=c(1,2,3,4,5,6,7)) > t1 x1 x2 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 7 7

R语言筛选出不重复的行的几种方法