一 前言
pandas数据拼接有可能会用到,比如出现重复数据,需要合并两份数据的交集,并集就是个不错的选择,知识追寻者本着技多不压身的态度蛮学习了一下下;
二 数据拼接
在进行学习数据转换之前,先学习一些数拼接相关的知识
2.1 join()联结
有关merge操作知识追寻者这边不提及,有空可能后面会专门出一篇相关文章,因为其学习方式根SQL的表联结类似,不是几行能说清楚的知识点;
join操作能将 2 个DataFrame 合并为一块,前提是DataFrame 之间的列没有重复;
# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
data1 = {
'user' : ['zszxz','craler','rose'],
'price' : [100, 200, 300],
'hobby' : ['reading','running','hiking']
}
index1 = ['user1','user2','user3']
frame1 = pd.DataFrame(data1,index1)
data2 = {
'person' : ['zszxz','craler','rose'],
'num