python数据分析常用模块_Python pandas模块21个常用操作可视化图解

Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力,Pandas 离这个目标已经越来越近了。

下面对pandas常用的功能进行一个可视化的介绍,希望能让大家更容易理解和学习pandas。

1、Series序列

系列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。

v2-d1bef0cc2ce22d4f50c071c42ddc36c1_720w.jpg

2、从ndarray创建一个系列

如果数据是ndarray,则传递的索引必须具有相同的长度。如果没有传递索引值,那么默认的索引将是范围(n),其中n是数组长度,即[0,1,2,3…. range(len(array))-1] – 1]。

sp200316_105731.png

3、从字典创建一个系列

字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典键以构造索引。如果传递了索引,索引中与标签对应的数据中的值将被拉出。

03.png

4、序列数据的访问

通过各种方式访问Series数据,系列中的数据可以使用类似于访问numpy中的ndarray中的数据来访问。

v2-c13227b77d40f0c3bf80788f74b76de0_720w.jpg

5、序列的聚合统计

Series有很多的聚会函数,可以方便的统计最大值、求和、平均值等

v2-0673c51616bd4a38df2bdab26c083268_720w.jpg

6、DataFrame(数据帧)

DataFrame是带有标签的二维数据结构,列的类型可能不同。你可以把它想象成一个电子表格或SQL表,或者 Series 对象的字典。它一般是最常用的pandas对象。

v2-c8941ad0749d5440a2a479bef672a5e4_720w.jpg

06.png

7、从列表创建DataFrame

从列表中很方便的创建一个DataFrame,默认行列索引从0开始。

v2-3d659c564b4e6e9decf9cc69d51fbc83_720w.jpg

8、从字典创建DataFrame

从字典创建DataFrame,自动按照字典进行列索引,行索引从0开始。

08.png

9、列选择

在刚学Pandas时,行选择和列选择非常容易混淆,在这里进行一下整理常用的列选择。

v2-caec796407529823db9907431b01aa70_720w.jpg

10、行选择

整理多种行选择的方法,总有一种适合你的。

v2-a64c9cd3bad09566fafee7f5a14af645_720w.jpg

v2-486fd5235c89f598348968360d36eebc_720w.jpg

v2-4031ff8c2231bcbddf1584addc0d6e51_720w.jpg

11、返回指定行列

pandas的DataFrame非常方便的提取数据框内的数据。

v2-eb522215a9a57e0fe8150e17045d14b3_720w.jpg

12、条件查询

对各类数值型、文本型,单条件和多条件进行行选择

v2-4475066481823a402d139079c58765d4_720w.jpg

v2-bd1de3a87b6462491776760a53d80f14_720w.jpg

13、聚合

可以按行、列进行聚合,也可以用pandas内置的describe对数据进行操作简单而又全面的数据聚合分析。

v2-040ac0ffb9238e7a87946eab029678dd_720w.jpg

13-2.png

14、聚合函数

data.function(axis=0) 按列计算

data.function(axis=1) 按行计算

v2-435e0afefe9aeb95b61c6b717b4a0e11_720w.jpg

15、分类汇总

可以按照指定的多列进行指定的多个运算进行汇总。

v2-a6f4c3102e82b2563320c62986c994e4_720w.jpg

16、透视表

透视表是pandas的一个强大的操作,大量的参数完全能满足你个性化的需求。

v2-2f13d7b2a98ab83cae09f93ae038bd95_720w.jpg

17、处理缺失值

pandas对缺失值有多种处理办法,满足各类需求。

17.png

18、查找替换

pandas提供简单的查找替换功能,如果要复杂的查找替换,可以使用map(), apply()和applymap()

v2-951c24f73ddea35d556d805f7bd1b403_720w.jpg

19、数据合并

两个DataFrame的合并,pandas会自动按照索引对齐,可以指定两个DataFrame的对齐方式,如内连接外连接等,也可以指定对齐的索引列。

v2-6bf2d9c297ec9b7bfc3847e105874c95_720w.jpg

20、更改列名(columns index)

更改列名我认为pandas并不是很方便,但我也没有想到一个好的方案。

v2-a40d4e7cef3fe84aad89ab89edfbd715_720w.jpg

21、apply函数

这是pandas的一个强大的函数,可以针对每一个记录进行单值运算而不需要像其他语言一样循环处理。

v2-c3d5428043861aaa5399131947928564_720w.jpg

v2-2608d41dd4381f0799ba565e20080b8f_720w.jpg

整理这个pandas可视化资料不易,如果你觉得本文对其他人有帮助,请分享给你的朋友,感谢感谢。

关注微信公众号:实战统计学,可以获取更多的Python数据挖掘实战案例。你不需要来我的网站就可以及时看到更新哦。

statr_weixin_qrcode.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值