目录
第二章(pandas)
Python数据处理从零开始----第二章(pandas)④数据合并和处理重复值
===============================================
数据合并
在数据处理中,通常将原始数据分开几个部分进行处理而得到相似结构的Series或DataFrame对象,我们该如何进行纵向合并它们?这时我们可以选择用pd.concat()方式极易连接两个或两个以上的Series或DataFrame对象。如下是该函数的参数解读:
pd.concat(objs, axis=0, join=’outer’, join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)
参数说明:
objs:连接对象,多以列表、字典传入
axis:轴向,0代表纵向连接,1,代表横向连接
join:连接方式,共有’inner’,’left’,right’,’outer’
join_axes:参与连接的索引
ignore_index:是否忽略索引
keys:层次化索引