数据组合方法
一.连接
1.1连接指的是 将某行或者某列追加到数据中.可以使用连接将多份数据数据拼接起来、把计算结果追加到现有数据集
加载数据
1.2使用concat函数连接
使用iloc,loc方法取出连接后的数据
1.3 使用 concat 连接DataFrame和Series
因为concat默认添加行,但Series没有行索引,所以添加一个新列,缺失数据用NaN填充
1.4 添加行
作为行连接, 可以创建DataFrame并制定列名
1.5 添加行 -append函数
-
5.1concat 可以连接多个对象,若只需要追加一个对象,可以通过append函数实现
1.5.2 使用Python字典添加行
append添加字典时候 必须传入ignore_index = True!
-
6重置索引
两个或多个DataFrame连接,可以通过ignore_index = True参数忽略后面df的索引
1.7 添加列--concat
与添加行类似,只需要多传入参数axis = 1 (axis默认值是index,按行添,传入axis = “ columns ”即可)
通过列名获得子集
1.8 添加列-- dataframe[‘列名’] = [‘值’]
添加列只需要dataframe[‘列名’] = [‘值’]
1.9 添加列-- dataframe[‘l列名’] = series对象 重置索引
合并数据后,重置列索引,获得有序索引
总结
以上就是今天要讲的内容,本文仅仅简单介绍了数据的连接使用方法.