CDA打卡活动-Python数据分析极简入门3

最新推荐文章于 2024-09-01 16:57:39 发布

阳光下的暖冬LEO

最新推荐文章于 2024-09-01 16:57:39 发布

阅读量1.3k

点赞数 34

文章标签： python 数据分析开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44314111/article/details/137515693

版权

课时7 Pandas数学计算

1. 聚合计算：聚合计算是指对数据进行汇总和统计的操作，常用的聚合计算方法包括计算均值、求和、最大值、最小值、计数等

df['a'].cumsum() # 累计求和

df['a'].cumprod() # 累计求积

2. 按行、列聚合计算：

df.sum(axis=0) # 按列求和汇总到最后一行

df.sum(axis=1) # 按行求和汇总到最后一列

df.describe() # 输出常用的描述性统计量

3. agg函数：

（1）对整个数据框df批量使用多个聚合函数

df.agg(['sum', 'mean', 'max', 'min', 'median'])

（2）对df的某些列应用不同的聚合函数（未应用某个函数，则对应的结果为NaN）

df.agg({'a': ['max', 'min'], 'b':['sum', 'mean'], 'c':['median']})

4. apply、applymap、map函数

这些函数可以对数据运用指定的函数，括号里面可以是函数式、自定义函数（def）或者匿名函数（lambda）

（1）对数据框的数据进行按行或按列操作时用apply()

df.apply(lambda x: x.max()-x.min(), axis=1) # axis=1，按行计算，即每行输出一个值

df.apply(lamda x: x.max()-x.min(), axis=0) # 默认参数为axis=0，按列计算，每列输出一个值

（2）对数据框的每一个数据进行操作时用applymap()，返回结果仍是dataframe格式

df.applymap(lambda x: 1 if x>60 else 0) # 系统自动对每一个数据进行判断，判断之后输出结果

（3）对series的每一个数据进行操作时用map()

df['a'].map(lambda x: 1 if x>60 else 0)

（4）总结：

apply()函数可以在dataframe或series上应用自定义函数，可以在行或列上进行操作

applymap()函数只适用于dataframe，可以在每个元素上应用自定义函数

map()函数只适用于series，用于将每个元素映射到另一个值

课时8 Pandas合并连接

在pandas中，有多种方法可以合并和拼接数据，常用的方法包括append()、concat()、merge()

1. 追加（append）

append()函数用于将一个dataframe或series对象追加到另一个dataframe中

df1.append(df2, ignore_index=True)

2. 合并（concat）

concat()函数用于沿指定轴将多个对象（比如series、dataframe）堆叠在一起，可以沿行或列的方向进行拼接。

pd.concat([df1, df2], axis=0) # 上下拼接

pd.concat([df1, df2], axis=1) # 左右拼接

3. 连接（merge）

merge()函数用于根据一个或多个键将两个dataframe的行连接起来，类似SQL中的JOIN操作

（1）两个数据框拥有同样的列

pd.merge(df1, df2, how='inner') # 只保留完全一样的数据

pd.merge(df1, df2, how='outer') # 合并数据，重复值只保留一次

（2）两个数据框拥有不同的列，df1有A、B列，df2有B、C列

pd.merge(df1, df2, how='left', on="A") # 左连接，保留df1的全部行，A列值相同

pd.merge(df1, df2, how='right', on="A") # 左连接，保留df2的全部行，A列值相同

pd.merge(df1, df2, how='inner', on="A") # 内连接，只保留相同值

pd.merge(df1, df2, how='inner', on="A") # 外连接，保留所有值

小技巧：

df1[df1['A'].isin(df2['A])] #返回在df1中列'A'的值在df2中也存在的行

df1[~df1['A'].isin(df2['A])] #返回在df1中列'A'的值在df2中不存在的行

课时9 Pandas分组聚合

分组聚合（group by）分两步：

（1）先分组：根据某列数据的值分组——用groupby()对某列进行分组

（2）后聚合：对结果应用聚合函数进行计算——在agg()函数里应用聚合函数

1. 单列分组

（1）对单列分组后对其他列应用sum：

df.groupby('A').sum()

（2）对单列分组后对指定的列应用单个指定的聚合函数，并实现重命名：

df.groupby('A').agg({'C':'min'}).rename(columns={'C': 'C_min'})

（3）对单列分组后对不同的列应用不同的聚合函数：

df.groupby(['A']).agg({'C':'max','D':'min'}).rename(columns={'C': 'C_max','D': 'D_min'})

2. 两列分组

（1）对多列分组后应用sum聚合函数：

df.groupby(['A','B']).sum()

（2）对两列进行groupby分组后，都应用max聚合函数：

df.groupby(['A','B']).agg({'C':'max'}).rename(columns={'C': 'C_max'})

（3）对两列进行groupby分组后，分别应用max、min聚合函数：

df.groupby(['A','B']).agg({'C':'max','D':'min'}).rename(columns={'C': 'C_max','D': 'D_min'})

阳光下的暖冬LEO

关注

34
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
CDA打卡活动-Python数据分析极简入门3

df.apply(lamda x: x.max()-x.min(), axis=0) # 默认参数为axis=0，按列计算，每列输出一个值。df.apply(lambda x: x.max()-x.min(), axis=1) # axis=1，按行计算，即每行输出一个值。pd.merge(df1, df2, how='left', on="A") # 左连接，保留df1的全部行，A列值相同。df1[df1['A'].isin(df2['A])] #返回在df1中列'A'的值在df2中也存在的行。
复制链接

扫一扫

阳光下的暖冬LEO CSDN认证博客专家 CSDN认证企业博客

码龄6年

11: 原创

139万+: 周排名

14万+: 总排名

5273: 访问

: 等级

211: 积分

70: 粉丝

97: 获赞

5: 评论

79: 收藏

私信

关注

热门文章

最新评论

CDA打卡活动-Python特征工程入门2-4.2
CSDN-Ada助手: 恭喜你写了第四篇博客！看来你对Python特征工程已经有了一定的了解了。接下来，我建议你可以深入研究一些高级的特征工程技术，比如特征选择、特征缩放等，这样可以帮助你更好地理解和应用Python特征工程。期待你的下一篇作品！加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
CDA打卡活动-Python特征工程入门3-4.2
CSDN-Ada助手: 恭喜您第5篇博客的成功发布！看到您在Python特征工程入门系列中的持续创作，我感到非常欣慰。在下一步的创作中，或许可以考虑深入探讨一些实际案例，结合实际应用场景进行分析，让读者更容易理解和接受。希望您可以继续保持创作的热情，不断提升自己的写作水平，期待您更多精彩的文章！祝您越来越好！
CDA打卡活动-统计学极简入门1-4.2
CSDN-Ada助手: 恭喜您在CDA打卡活动中发布了第6篇博客！标题为“统计学极简入门1-4.2”的内容看起来非常有趣和有价值。希望您能继续保持创作的热情和努力，为读者带来更多优质的内容。或许在下一篇博客中，可以深入探讨统计学的实际应用场景，让读者更加直观地理解统计学的重要性。期待您的下一篇作品！
CDA打卡活动-Python数据分析极简入门1-4.2
CSDN-Ada助手: 恭喜您在CDA打卡活动中发布了第7篇博客！看到您分享的Python数据分析入门内容，让我受益良多。希望您能继续保持创作的热情和努力，不断提升自己的写作水平。下一步，我建议您可以探索更多数据分析的技术细节，深入挖掘实践经验，让读者能够更全面地了解这个领域。期待您的更多精彩内容！
CDA打卡活动-Python数据分析极简入门2-4.2
CSDN-Ada助手: 恭喜您写了第8篇博客！看到您在CDA打卡活动中分享的Python数据分析入门系列，我不禁感到非常欣慰。希望您能继续坚持创作，让更多人受益。下一步，或许可以考虑深入一些高级数据分析技术，或者分享一些实战经验，让读者更加深入地了解Python数据分析的应用。期待您的精彩继续！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。