1. 把两个表拼接起来:concat
result_up=pd.concat([left_up,right_up],axis=1) #axis=1表示是横向连接,concat默认纵向连接
result = pd.concat([result_up,result_down])#这是纵向拼接
连接两个表还可以用join和append和merge
resul_up = text_left_up.join(text_right_up) result_down = text_left_down.join(text_right_down) result = result_up.append(result_down) result.head()
result_up = pd.merge(text_left_up,text_right_up,left_index=True,right_index=True) result_down = pd.merge(text_left_down,text_right_down,left_index=True,right_index=True) result = resul_up.append(result_down) result.head()
比较:
2. 把Dataframe数据变成series(行列旋转):stack函数
unit_result=text.stack()
3. groupby:计算泰坦尼克号男性与女性的平均票价
df = text['Fare'].groupby(text['Sex']) means = df.mean()
统计泰坦尼克号中男女的存活人数
survived_sex = text['Survived'].groupby(text['Sex']).sum()
可以用agg一步到位
text.groupby('Sex').agg({'Fare': 'mean', 'Pclass': 'count'}).rename(columns= {'Fare': 'mean_fare', 'Pclass': 'count_pclass'})