pandas实现groupby每个分组的apply

且看行云

于 2023-03-31 23:23:19 发布

阅读量270

点赞数

文章标签： pandas python 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_65560393/article/details/129846892

版权

Groupby遵从split（先进行分组）、apply（对分组进行处理）、combine（拼接成最终df）模式

对数值列按照分组进行归一化

1.对数据进行横向处理，方便对比

公式：X = $\frac{X-Xmin}{Xmax-Xmin}$

import pandas as pd
def rating_normal(x):
   max_value=x.max()
   min_value=x.min()
   x=x.apply(lambda x:x-min_value/(max_value-min_value))
   return x
ratings_df = pd.DataFrame(ratings)
ratings_grouped = ratings_df.groupby("user_id")["rating"].apply(rating_normal)
ratings_grouped = ratings_grouped.reset_index(drop=True)

每个分组的TOP数据

#实现每一个分组的topn数据
def  getWinduTopN(df,topn):
     return df.sort_values(by="wendu")[["ymd,wendu"]][-topn:]
df.groupby("month").apply(getWendutopn,topn=2).head()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas实现groupby每个分组的apply

Groupby遵从split（先进行分组）、apply（对分组进行处理）、combine（拼接成最终df）模式。
复制链接

扫一扫

且看行云 CSDN认证博客专家 CSDN认证企业博客

码龄3年

13: 原创

152万+: 周排名

91万+: 总排名

1050: 访问

: 等级

130: 积分

0: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

零基础pandas第七天
且看行云: 第一行代码需要修改 import os import pandas as pd work_dir = r"C:\Users\Ziyin\Desktop" splits_dir = os.path.join(work_dir, "splits") if not os.path.exists(splits_dir): os.mkdir(splits_dir) excel_file_path = os.path.join(work_dir, "Rainfall_data.xlsx") df_source = pd.read_excel(excel_file_path) df_source.head() 1.work_dir 下不能出现文件名，否则会报错 2.splits_dir要在if函数之前，否则会找不到路径 3.路径那里如果要使用\，则需要在前面加上r，或者使用/ 4f"{work_dir}/splits"这里要使用{}，不能用[],否则会报错
零基础学pandas第一天
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。