pandas 处理数据时快捷方法

1. dt1 中有的数据,在dt2 中也有,取dt1中有,dt2中没有的数据

# 方法一:

user_push = pd.DataFrame(columns=dt1.columns)
for user, group in dt1.groupby(by=['user_id']):
    push_history = dt2[dt2.user_id == user]['item_id'].values
    group = group[~group.item_id.isin(push_history)]
    if not group.empty:
#         group = group.sample(1)
        group.loc[:, 'user_id'] = user
        user_push = pd.concat((user_push, group))
user_push

方法二:
slice_lable = (
    dt1[['user_id','item_id']].apply(tuple, axis=1).isin(dt2[['user_id','item_id']].apply(tuple, axis=1).to_list())
)
slice_lable
user_push = dt1[~slice_lable]
user_push

 返回结果:

2. 对dt1 中按照user_id 进行分组,按照cnt 进行排序,取用户的前n个

dt1.sort_values('cnt', ascending=False).groupby('user_id', as_index=False).first()

dt1.sort_values('cnt', ascending=False).groupby('user_id', as_index=False).head(4)

3. dataframe 进行分组,分组后将对应的数据进行按照一定的字符拼接

test_data = faq_dts[['user_id','user_content']]
test_data.head()

test_data[test_data['user_id']=='2022110904231319'].groupby(['user_id']).user_content.apply(lambda x:x.str.cat(sep=' ')).reset_index()

4. 把字符串的字典转化为字典类型

a = "{'name' : 'jim', 'sex' : 'male', 'age': 18}"
b = eval(a)


import json
c = json.loads(a)#c的类型也是字典类型的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值