使用python进行数据处理,常免不了做数据拼接。可是因为常用的数据容器类型不少,有List,array,DataFrame等,时不时搞混(根本原因是以前偷懒一直没用心去记-_-’)。终于痛定思痛,决定好好整理记录下来,并养成好习惯。。。
以下按照不同数据容器类型,整理出了可用的数据拼接方法。
(一) List
python为列表提供的拼接方法,首先是append和extend。其中append是把参数整个作为元素回到原列表的末尾作为一个元素,而extend则是把参数列表的所有元素作为原列表的新元素追加到末尾。另外有一点需注意的是,append和extend调用的结果是直接修改原列表,无返回值。 例子如下:
除此以外,python中的+和+=操作符,作用在列表上,也具有拼接的功能。其中,+=的实现的功能和extend一样,而+则和extend略有不同:其返回的是一个新列表,而非原列表。例子如下:
(二) DataFrame
DataFrame提供的拼接功能要更为丰富一些。大抵可以概括为非条件拼接和条件拼接两种(非条件拼接和条件拼接是我为了便于理解记忆自己杜纂的,因此莫问出处)。
1. 非条件拼接
非条件拼接包括append和concat。