python 合并数据集_Python 联合与合并数据集 - 树懒学堂

联合与合并数据集

包含在pandas对象的数据可以通过多种方式联合在一起:

pandas.merge根据一个或多个键将行进行连接。对于SQL或其他关系型数据库的用户来说,这种方式比较熟悉,它实现的是数据库的连接操作。

pandas.concat使对象在轴向上进行黏合或“堆叠”。

combine_first实例方法允许将重叠的数据拼接在一起,以使用一个对象中的值填充另一个对象中的缺失值。

1、数据库风格的DataFrame连接

合并或连接操作通过一个或多个键连接行来联合数据集。这些操作是关系型数据库的核心内容(例如基于SQL的数据库)。pandas中的merge函数主要用于将各种join操作算法运用在你的数据上:

image-204.png

这是一个多对一连接的例子;df1的数据有多个行的标签为a和b,而df2在key列中每个值仅有一行。调用merge处理我们获得的对象:

image-205.png

并没有指定在哪一列上进行连接。如果连接的键信息没有指定,merge会自动将重叠列名作为连接的键。但是,显式地指定连接键才是好的实现:

image-206.png

如果每个对象的列名是不同的,你可以分别为它们指定列名:

image-207.png

默认情况下,merge做的是内连接(’inner’join),结果中的键是两张表的交集。其他可选的选项有’left’、’right’和’outer’。外连接(outer join)是键的并集,联合了左连接和右连接的效果:

image-208.png

下表是对how选项的总结。

image-209.png

2、根据索引合并

在某些情况下,DataFrame中用于合并的键是它的索引。在这种情况下,你可以传递left_index=True或right_index=True(或者都传)来表示索引需要用来作为合并的键:

image-210.png

由于默认的合并方法是连接键相交,可以使用外连接来进行合并:

image-211.png

3、沿轴向连接

另一种数据组合操作可互换地称为拼接、绑定或堆叠。NumPy的concatenate函数可以在NumPy数组上实现该功能:

image-212.png

在Series和DataFrame等pandas对象的上下文中,使用标记的轴可以进一步泛化数组连接。尤其是还有许多需要考虑的事情:

如果对象在其他轴上的索引不同,是否应该将不同的元素组合在这些轴上,还是只使用共享的值(交集)?

连接的数据块是否需要在结果对象中被识别?

“连接轴”是否包含需要保存的数据?

在许多情况下,DataFrame中的默认整数标签在连接期间最好丢弃。

pandas的concat函数提供了一种一致性的方式来解决以上问题。

image-213.png

用列表中的这些对象调用concat方法会将值和索引粘在一起:

image-214.png

默认情况下,concat方法是沿着axis=0的轴向生效的,生成另一个Series。如果传递axis=1,返回的结果则是一个DataFrame(axis=1时是列):

image-215.png

在这个案例中另一个轴向上并没有重叠,可以看到排序后的索引合集(’outer’ join外连接)。也可以传入join=’inner’:

image-216.png

下表是concat函数的参数。

image-217.png

4 、联合重叠数据

还有另一个数据联合场景,既不是合并操作,也不是连接操作。可能有两个数据集,这两个数据集的索引全部或部分重叠。作为一个示例,考虑NumPy的where函数,这个函数可以进行面向数组的if-else等价操作:

image-218.png

Series有一个combine_first方法,该方法可以等价于下面这种使用pandas常见数据对齐逻辑的轴向操作:

image-219.png

在DataFrame中,combine_first逐列做相同的操作,因此可以认为它是根据传入的对象来”修补“调用对象的缺失值:

image-220.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
如果你想要在 ElementUI-Plus 的 Table 树形结构中进行懒加载并判断是否有子节点数据,可以使用 `lazy` 属性和 `load` 方法实现。具体实现步骤如下: 1. 在 Table 组件中设置 `:lazy="true"`,开启懒加载模式。 2. 在 Table 组件中设置 `:load="loadData"`,指定加载数据的方法。 3. 在 `loadData` 方法中,根据当前节点的 `level` 和 `expanded` 状态来判断是否需要加载该节点的子节点数据。 4. 如果需要加载子节点数据,可以使用异步请求获取数据,并在回调中将数据作为参数传递给 `resolve` 方法。如果不需要加载子节点数据,可以直接调用 `resolve([])` 方法返回一个空数组。 下面是一个示例代码,帮助你更好地理解如何实现这个功能: ```vue <template> <el-table :data="data" :lazy="true" :load="loadData" tree-key="id" :tree-props="{children: 'children'}" > <el-table-column label="名称" prop="name"></el-table-column> <el-table-column label="状态" prop="status"></el-table-column> </el-table> </template> <script> export default { data() { return { data: [] } }, methods: { loadData(node, resolve) { if (node.level === 0) { // 根节点的数据 this.$http .get('/api/data') .then(response => { resolve(response.data) }) } else { // 非根节点的数据 if (node.expanded) { // 当前节点已经展开,需要加载子节点数据 this.$http .get(`/api/data/${node.data.id}`) .then(response => { resolve(response.data.children) }) } else { // 当前节点没有展开,无需加载子节点数据 resolve([]) } } } } } </script> ``` 在这个示例中,我们使用了 `resolve` 方法来返回异步获取的子节点数据或空数组。同时,我们还使用了 `node.level` 和 `node.expanded` 属性来判断当前节点的状态,从而决定是否需要加载子节点数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值