利用python进行数据分析—五、pandas入门

最新推荐文章于 2024-05-07 12:06:43 发布

哎呦-_-不错

最新推荐文章于 2024-05-07 12:06:43 发布

阅读量2.3k

点赞数 1

分类专栏： # 《利用python进行数据分析》学习文章标签：利用python进行数据分析 pandas入门

本BLOG上原创文章未经本人许可，不得用于商业用途，转载请注明出处。

本文链接：https://blog.csdn.net/weixin_46649052/article/details/114787362

版权

这篇博客介绍了pandas的基础知识，包括Series和DataFrame数据结构，如何进行数据选择、过滤，以及算术操作和数据对齐。还讨论了如何进行数据重塑、排序和统计分析，如相关性、唯一值计算。

摘要由CSDN通过智能技术生成

文章目录

引言

pandas是用来处理表格型或异质型（异质性就是说研究的样本的重要属性上存在差异）数据的，常用于数据清洗与分析。pandas常与Numpy和Scipy以及数据可视化工具matplotlib一起使用。

5.1pandas数据结构介绍

pandas有两种常用的数据结构：Series和DataFrame

5.1.1Series

Series是一维的数组型对象，包括一个值序列与索引。

values属性和index属性获得Series对象的值与索引

在这里插入图片描述
使用字典生成一个Series，当你把字典传给Series函数时，产生的Series索引将是排序好的字典键。

pandas使用isnull和notnull函数来检查缺失数据

自动对齐索引

Series对象自身与索引都有name属性
在这里插入图片描述
Series的索引可以通过按位置赋值的方式进行改变

5.1.2DataFrame

DataFrame既有行索引，又有列索引。尽管DataFrame是二维的，但是可以利用分层索引在DataFrame中展示更高维度的数据。
构建DataFrame的最常用方式：利用包含等长度列表或者Numpy数组的字典来形成DataFrame
在这里插入图片描述
DataFrame指定列顺序

传的列不在字典中，将会在结果中出现缺失值

columns参数指定列索引
index参数指定行索引
同时，DataFrame也有columns与index属性

在这里插入图片描述
通过索引返回指定列，返回类型为Series，返回的Series与原DataFrame有相同的索引

使用loc访问行，iloc针对默认的数字索引（位置）

当将列表或

最低0.47元/天解锁文章

哎呦-_-不错

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。