合并数据集
pandas可以通过内置方式进行合并
pandas.merge 根据键不同 将DataFrame中的行连接起来
pandas.concat沿着 一条轴将多个对象堆叠到一起
实例方法 combine_first 可以将重复数据编接在一起
数据库风格的DataFrame合并
使用pd.merge函数, 使用on参数指定键
默认情况下,取交集。通过 how 设置 取并集
合并 索引会被丢弃
索引上的合并
传入left_index=True 或者 right_index=True 说明索引应该被用作连接键
对于层次化索引需要指明用做合并键的多个列
还支持join
轴向连接
默认情况下,concat 函数 在axis=0 上工作,产生一个Series axis=1 产生DataFrame
合并重叠数据
可以使用np.where 相当于一种矢量化的if-else
对于DataFrame combine_first 也会做同样的事情,可以看做打补丁
重塑和轴向旋转
????
将长格式 旋转 为 宽格式
对ldata 进行转换
前面两个参数 用作行和列索引的列名,最后一个参数则是用于填充DataFrame的数据列的列名
忽略最后一个参数,就会得到有层次化
数据转换
移除重复数据
duplicated方法返回一个布尔型Series,表示各行是否是重复行
而drop_duplicated 方法 移除重复行