《利用Python进行数据分析》—第5章 pandas入门

最新推荐文章于 2024-09-18 20:39:31 发布

旧迹斑驳

最新推荐文章于 2024-09-18 20:39:31 发布

阅读量224

点赞数

分类专栏：利用python进行数据分析文章标签： python 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43331565/article/details/107932328

版权

利用python进行数据分析专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Series

Series可以看成是一个定长的有序字典。
Series对象本身及其索引都有一个name属性。
在这里插入图片描述
索引可以通过赋值的方式进行修改。

DataFrame

DataFrame可以看成是由Series组成的字典（共用同一个索引）。
其实，DataFrame中的数据是以一个或多个二维块存放的（而不是列表、字典或别的一维数据结构）。
DataFrame也可以设置index和columns的name属性。
在这里插入图片描述

重新索引

reindex方法可以对Series和DataFrame进行重排，传入一个新索引，若新索引在当前索引中找不到，就用NA（NaN）值填充，也可以设置fill_value参数用特定的值填充。
在这里插入图片描述
传入columns关键字即可重新索引列。

索引、选取和过滤

在这里插入图片描述
几个特殊用法：

通过布尔型数组选取行
（我把它记忆为：选取满足某个列的特定条件的行。）

算术运算和数据对齐

相同索引会自动对齐并进行算术运算，找不到相同索引的显示NaN。
在这里插入图片描述

函数应用和映射

Numpy的元素级数组方法也可以用于操作pandas对象。
在这里插入图片描述
apply的用法：

除了标量值外，传给apply的函数还可以返回由多个值组成的Series。
apply的应用很多，在以后的实践中要多尝试用apply来解决问题。

Serie有一个应用于元素级函数的map方法。
在这里插入图片描述

排序和排名

在这里插入图片描述

唯一值、值计数以及成员资格

唯一值：unique的用法
值计数：value_counts的用法
计算一个Series中各值出现的频率。可用于任何数组和序列。
isin：用于判断Series各值是否包含在传入的值序列中。

处理缺失数据

pandas中的缺失值用NaN（not a number）表示
python内置的None值也被当做NA处理

过滤缺失数据

填充缺失数据

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。