数据分析之python(二)

筛选

data['age']>35
data[data['age']>35]  #筛选出age大于35的数据

去重

data.drop_duplicates(subset='uid',keep='first',inplace='True')  #subset指定去重字段,keep保留重复值的第一个值,inplace默认为False不改变原数据,True为修改原数据

合并

concat_demo = pd.concat([data,data2],axis=0)

连接

pd.merge(concat_demo,user_level,how='inner',on='uid')  #左表和右表,how选择连接方式,on为连接字段
pd.merge(concat_demo,user_level,how='inner',lift_on='uid',right_on='user_id')  #列名不同时的连接

字段重命名

data2.rename(columns={'uid':user_id},inplace=True)

删除字段

data.drop('uid',axis=1)

排序

data.sort_values(['uid','age'],ascending=[True,False])  #True为升序,False为降序

匿名函数

sum = lambda x,y:x+y
sum(2,4)    #6

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值