pandas
weixin_42653353
这个作者很懒,什么都没留下…
展开
-
dataframe 添加分组列
#设置切分区域listBins = [0, 10, 20, 30, 40, 50, 60, 500]#设置切分后对应标签listLabels = ['0','1','2','3','4','5','6']movie_s_pd['fenzu'] = pd.cut(movie_s_pd['danjia'], bins=listBins, labels=listLabels, include_lowest=True)labels 比bins 少1...原创 2021-04-23 13:47:39 · 312 阅读 · 0 评论 -
DataFrame 表关联 join
两个表 通过某一字段关联 f1:f2:f1.set_index('id').join(f2.set_index('id'))结果:原创 2021-03-18 15:10:00 · 261 阅读 · 1 评论 -
DataFrame对某一列中单元格的操作 map
会遇到dataframe中单元格既不是nan 又不是None 的 比如这种created_at catefirst 2020-04-01 取得这种catefirst为空的需要用到pd[(pd['catefirst'] == "")]这时候能把空值找出如果是对这一列来操作的话 处理空值 填充为0 或者别的 可以用map函数#只对为空的或者为None的单元格替换为“无” 其余有正常值的保持不变def catefirstmap(x): if x=...原创 2021-03-18 13:29:54 · 635 阅读 · 0 评论 -
pandas 查询交集 ~的用处
即购买实体 又购买虚拟的user_idall_gouwu.query('type=="实体"')[all_gouwu['user_id'].isin(all_gouwu.query('type=="虚拟"')['user_id'])]只购买实体的user_idall_gouwu.query('type=="实体"')[~all_gouwu['user_id'].isin(all_gouwu.query('type=="虚拟"')['user_id'])]...原创 2021-03-01 11:37:12 · 83 阅读 · 0 评论