一、合并(Merge)
1. Concat 连接
pandas 提供了多种便捷功能,可轻松将 Series 和 DataFrame 对象组合在一起,并且在进行连接/合并类型操作时,还能运用各种集合逻辑来处理索引,以及借助关系代数功能实现相关操作。
使用 concat()
函数将 Pandas 对象按行顺序连接起来
向 DataFrame 添加一列的速度相对较快。然而,添加一行则需要进行复制操作,可能会比较耗费资源。我们建议将预先构建好的记录列表传递给 DataFrame 构造函数,而非通过逐次向其追加记录的方式来构建 DataFrame。
2. join连接
merge() 函数支持基于特定列进行 SQL 样式的连接操作。
如果 key
的值唯一
二、分组(Grouping)
这里所说的“分组”指的是包含以下一个或多个步骤的过程:
- 根据某些标准将数据分组
- 对每个组分别应用一个函数
- 将这些结果整合到一个数据结构中
按照某一列标签进行分组,选取列标签,然后将 DataFrameGroupBy
的 sum()
函数应用于所得的分组结果上