Python数据分析：pandas常用函数

最新推荐文章于 2024-06-03 22:55:15 发布

yhlp

最新推荐文章于 2024-06-03 22:55:15 发布

阅读量1.3k

点赞数 7

分类专栏： python数据分析文章标签：数据分析 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43679030/article/details/86377402

版权

python数据分析专栏收录该内容

12 篇文章 2 订阅

订阅专栏

pandas是python中的一个数据处理库，同样在使用的时候我们要先输入import pandas as pd引入。

1.df = pd.read_csv("文件路径")：这是读取csv文件的方法，如果要读取excel或其他文档，都有相应的read函数。在这里插入图片描述

2.df.dtypes：如果在文件中有字符型数据返回的是object。在这里插入图片描述

3.df.head(n)：将前n行数据显示出来，如果不传入参数则显示前5行数据。在这里插入图片描述

4.df.tail(n)：将后n行数据显示出来，如果不传入参数则显示后5行数据。在这里插入图片描述

5.df.columns：以列表的形式显示数据表的列名。

6.df.shape：以元组的形式显示表中数据的行数和列数。

7.df.loc[n]：返回索引值为n的行。

8.df.loc[m][n]：返回索引值为m行n列的数据。在这里插入图片描述

9.df.loc[m:n]：返回索引值为m到n的行。

10.df.loc[[m,n,k]]：返回索引值分别为m,n,k的行。在这里插入图片描述

11.df["str"]：返回列名为str的这一列。在这里插入图片描述

12.df.columns.tolist()：将列名做成列表。在这里插入图片描述

13.df["str"]*df["str"]：两列维度相同，则两列的对应位置相乘。在这里插入图片描述

14.df.sort_values("str",inplace=True,ascending=False)：将str一列按照降序排列，且得到的数据替换原数据。inplace表示是否用排序后的数据替代原数据，默认为False，也就是不替换。ascending表示排序的顺序，默认为True，也就是按照升序排列。在这里插入图片描述

15.judge = pd.isnull(df["str"])：返回bool型值，str这一列的数据是空值返回True，不是空值返回False。在这里插入图片描述

16.a["judge"]：返回judge为True，也就是缺失的数据，这时再调用len()函数即可求得缺失数据的个数。在这里插入图片描述

17.df.pivot_table(index="a",values="b",aggfunc=np.mean)：这是一个很重要的函数，将b求平均值，按照a的类别进行分类，第三个参数默认为求平均值。在这里插入图片描述

18.df.loc[n,"str"]：定位到第n行，列名为str处的数据。

19.sort_res.reset_index(drop=True)：将排序后的数据的编号也重新排列，drop指是否丢弃原数据。运行后的结果与14的图对比可以发现，编号已经重新排列了。在这里插入图片描述

20.df.apply()：这是在pandas中的自定义函数的使用方法，括号中传入函数名。在这里插入图片描述

关注

7
点赞
踩
39

收藏

觉得还不错? 一键收藏
2
评论
Python数据分析：pandas常用函数

pandas是python中的一个数据处理库，同样在使用的时候我们要先输入import pandas as pd引入。
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。