筛选
data['age']>35
data[data['age']>35] #筛选出age大于35的数据
去重
data.drop_duplicates(subset='uid',keep='first',inplace='True') #subset指定去重字段,keep保留重复值的第一个值,inplace默认为False不改变原数据,True为修改原数据
合并
concat_demo = pd.concat([data,data2],axis=0)
连接
pd.merge(concat_demo,user_level,how='inner',on='uid') #左表和右表,how选择连接方式,on为连接字段
pd.merge(concat_demo,user_level,how='inner',lift_on='uid',right_on='user_id') #列名不同时的连接
字段重命名
data2.rename(columns={'uid':user_id},inplace=True)
删除字段
data.drop('uid',axis=1)
排序
data.sort_values(['uid','age'],ascending=[True,False]) #True为升序,False为降序
匿名函数
sum = lambda x,y:x+y
sum(2,4) #6