个人pandas学习笔记

AgnesDigital

于 2023-10-31 18:50:10 发布

阅读量19

点赞数

文章标签： pandas 学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AgnesDigital/article/details/134146870

版权

常用代码集合：pandas用法-全网最详细教程-CSDN博客

pycharm引入csv：pycharm读取CSV文件-CSDN博客

1.1 认识series

numpy中，array数组是list的进阶版，同理，pandas库也为我们提供了字典的进阶版：series。

其创建方式有两种，一种是直接引入已有字典，如：

*注意Series开头大写

最后输出为：

显然，series与字典的一大不同之处在于它是竖直的，并且会于末尾显示value的数据类型。

当然，直接引入key数组和value数组也可以创建series：

需要注意的是，无论引入的是数组还是列表还是其它格式，进入

series后都会统一格式化为数组。

二维series

我们可以将两个一维series合成为二维series，具体方式为:

a = pd.Dataframe({“索引1”：series1,“索引2”：series2})

如果索引1与索引2使用了同一套keys，则最后会显示为：

如果使用的keys不同，则不同的项会被单独列为一行，另一套keys缺失的部分会显示为NaN，例子：

同样的，二维series的创建也支持输入行索引（index），列索引(columns)与值矩阵(value)来进行快捷创建，如：

*这里的值矩阵为了使元素统一格式，自动将数字转换为了字符串，但进入series后，它会被设置成兼容多种格式的object类型。

series的索引

series的二维索引

在一维索引中，若显性索引不是数字，则可以不写索引器，但在二维series中，索引器的存在是必须的

显然的，在二维series中检索元素需要提供两个索引，而使用花式索引检索多个元素时，同类型的索引应该置于一起。除此之外，花式索引也不再仅仅输出向量，而是同样输出二维series，这是由series的特性决定的。

二维series的切片：

方法与一维切片大致相同，只是注明范围的格式由[a:b]变为[a:b,c:d]，例子：

转置

转置代码仍然支持。

同理，翻转仍然支持。

series的重塑

由于行标签与列标签的存在，.reshape()已不再适用，重塑操作限制于增添/独立出新的行或列：

series合并

例子：

而二维series与一维series合并则简单得多，以合并列对象为例子：

行对象合并则须使用loc：

二维对象与二维对象的合并：

*axis不写时默认为0，即添加行个体

对象与系数间的运算：

参考numpy，此处仅提供备忘代码表。

对象间运算（一维）：

同理，是精确的单对单，任意一方的对应数据为缺失时，返回NaN

对象间运算（二维）：

由于不能确保数据全为数字，故运算时须注明行/列，其它无区别：

缺失值的处理

*isnull()并非提取出缺失数据，而是将对象内数据转化为布尔类型

缺失值清除：

填充缺失数据：

*二维的方法完全相同

数据分析处理方法：

也可以使用方法，一次性查看以上所有特征：

数据透视：

数据透视，是一种锁定某几项特征数据，分析其它数据与它的关联性的方法。

图中，pd.cut()意思是将目标index/column值重置为括号内的对应区间，例如我们有一组年龄数据，对其使用pd.cut(0，25，120)后，0到25岁的”年龄“数据会直接变为（0，25]，25到一百二十岁的同理。

而pd.qcut（）意思是对数据进行等分，等分数目为括号内数。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
个人pandas学习笔记

图中，pd.cut()意思是将目标index/column值重置为括号内的对应区间，例如我们有一组年龄数据，对其使用pd.cut(0，25，120)后，0到25岁的”年龄“数据会直接变为（0，25]，25到一百二十岁的同理。除此之外，花式索引也不再仅仅输出向量，而是同样输出二维series，这是由series的特性决定的。在一维索引中，若显性索引不是数字，则可以不写索引器，但在二维series中，索引器的存在是必须的。同理，是精确的单对单，任意一方的对应数据为缺失时，返回NaN。
复制链接

扫一扫

AgnesDigital CSDN认证博客专家 CSDN认证企业博客

码龄1年

3: 原创

186万+: 周排名

172万+: 总排名

49: 访问

: 等级

30: 积分

0: 粉丝

0: 获赞

3: 评论

0: 收藏

私信

关注

热门文章

最新评论

个人numpy学习笔记
CSDN-Ada助手: 恭喜你开始博客创作！标题为“个人numpy学习笔记”听起来很有趣，我很期待读到你的学习心得和经验。在下一篇博客中，也许你可以分享一些实际应用numpy的案例，或者深入探讨一些更高级的功能。继续努力，期待看到更多精彩的内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
个人pandas学习笔记
CSDN-Ada助手: 非常棒的学习笔记！你对pandas的理解已经很深入了。我鼓励你继续写下去，将你的学习心得和经验分享给更多的人。关于这篇博文，我想补充一些和pandas相关的扩展知识和技能。除了pd.cut()和花式索引的应用，你还可以学习和了解以下内容： 1. 数据清洗和处理：pandas提供了很多功能强大的方法，如处理缺失值、重复值、异常值等。你可以学习如何使用dropna()、fillna()和replace()等方法来清洗和处理数据。 2. 数据分析和统计：pandas还提供了丰富的统计分析功能，比如描述性统计、相关性分析、分组聚合等。你可以学习如何使用describe()、corr()和groupby()等方法进行数据分析和统计。 3. 数据可视化：pandas可以与matplotlib等数据可视化工具结合使用，帮助你更好地理解和展示数据。你可以学习如何使用plot()、hist()和scatter()等方法进行数据可视化。希望以上内容对你有所帮助，期待看到你更多的学习笔记！继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
个人mat学习笔记
CSDN-Ada助手: 恭喜您撰写了第三篇博客！标题中的“个人mat学习笔记”让我感到非常兴奋。您的学习笔记将为其他人提供宝贵的学习资料和经验分享。在下一步的创作中，我建议您可以尝试对一些MAT问题进行更深入的研究，并将您的见解和解决方案与读者分享。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。