Joining Dataframes

  • 一个变量存在于两个表中,并可唯一标识其中一个表。相对于可唯一标识的表,该变量称主键;相对于另一个表,该变量称外键
  • 人为添加的主键称代理键
    如:
flights %>% mutate(iden=row_number())
#iden就是代理键,将每个观测值依次标为1,2,3...
#judge whether the key is a primary key
Lahman::Batting %>%
  count(playerID, yearID, stint) %>%
  filter(n > 1) %>%
  nrow()
#> [1] 0
#I can conclude that this set of three keys are primary keys

#a more direct way
ggplot2::diamonds %>%
  distinct() %>%
  nrow()
#> [1] 53794
nrow(ggplot2::diamonds)
#> [1] 53940
#if the latter number is larger,it denotes that the dataset does not have a primary key

合并连接

1.连接方式
内连接(只保留相同) ,左连接(保留左侧),右连接(保留右侧),全连接(两侧都保留)
#无对应部分用NA代替
#重复部分依次对应连接

格式均为:

inner_join(x,y,by="key")
left_join(x,y,by="key")
#诸如此类.by = 可以省略

2.键列

  • by = NULL(直接不写) 直接将所有公共变量当成键
  • by = c(“a”=“b”) 将左表的a和右表的b连接
#show the route of flights
flights_latlon <- flights %>%
  inner_join(select(airports, origin = faa, origin_lat = lat, origin_lon = lon),
    by = "origin"
  ) %>%
  inner_join(select(airports, dest = faa, dest_lat = lat, dest_lon = lon),
    by = "dest"
  )

筛选连接

  • semi_join( ):保留左表中某变量与右表匹配的部分
  • anti_join():去除左表中某变量与右表匹配的部分

集合

intersect(a,b) 可以将a、b中的共同元素显示出来

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
毕业设计,基于SpringBoot+Vue+MySQL开发的公寓报修管理系统,源码+数据库+毕业论文+视频演示 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本公寓报修管理系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息,使用这种软件工具可以帮助管理人员提高事务处理效率,达到事半功倍的效果。此公寓报修管理系统利用当下成熟完善的Spring Boot框架,使用跨平台的可开发大型商业网站的Java语言,以及最受欢迎的RDBMS应用软件之一的MySQL数据库进行程序开发。公寓报修管理系统有管理员,住户,维修人员。管理员可以管理住户信息和维修人员信息,可以审核维修人员的请假信息,住户可以申请维修,可以对维修结果评价,维修人员负责住户提交的维修信息,也可以请假。公寓报修管理系统的开发根据操作人员需要设计的界面简洁美观,在功能模块布局上跟同类型网站保持一致,程序在实现基本要求功能时,也为数据信息面临的安全问题提供了一些实用的解决方案。可以说该程序在帮助管理者高效率地处理工作事务的同时,也实现了数据信息的整体化,规范化与自动化。 关词:公寓报修管理系统;Spring Boot框架;MySQL;自动化;VUE
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值