Pandas文件读取常用的数据操作方法

最新推荐文章于 2024-05-07 16:43:44 发布

后知还就那个后觉

最新推荐文章于 2024-05-07 16:43:44 发布

阅读量2.2k

点赞数 1

分类专栏：深度学习文章标签： Pandas文件读取常用的数据操作方法 Pandas常用预处理方法 Pandas的sort_values方法 Pandas的pivot_table方法 Pandas的dropna方法

本文链接：https://blog.csdn.net/niruoanhaoshiqintian/article/details/82931009

版权

深度学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

Pandas文件读取常用的数据操作方法

本篇博客是接着上篇博客python数据分析处理库-Pandas数据读取、索引与计算

import pandas
food_info = pandas.read_csv("food_info.csv") #读取与本python文件同一目录下的food_info.csv文件
food_info.sort_values("列名", inplace=True) #对文件该列进行排序，inplace=True表示排序后覆盖此列
                                             (默认从小到大排序)
food_info.sort_values("列名", inplace=True，ascending=False) #同上，区别是从大到小排序

-----除去列中的为空NaN(NaN)的元素
lie = food_info["列名"]
lie.loc[0:10] #切片方式查看前10个元素
lie_is_null = pandas.isnull(lie) #查看该列为空(NaN)的所有元素，是空的返回true，不空返回false
lie_null_true = lie[lie_is_null] #查看该列为空(NaN)的所有元素,当然返回都是NaN
len(lie_null_true) #查看该列为空(NaN)的元素有多少个
lie_not_null = food_info["列名"].[lie_is_null == False] #查看该列不为空(NaN)的所有元素

food_info["列名"].mean() #求该列的平均值

-----以列名1为索引，将列名1中相同的元素对应的列名2中的值加起来求平均值，默认是aggfunc=np.mean
food_info.pivot_table(index="列名1", values="列名2", aggfunc=np.mean)

-----以列名1为索引，将列名1中相同的元素对应的列名2和列名3中的值加起来分别求和
food_info.pivot_table(index="列名1", values=["列名2", "列名3"], aggfunc=np.sum)

-----将列名1和列名2中为空(NaN)的丢掉
food_info.dropna(axis=0, subset=["列名1", "列名2"])

-----定位到某个元素，行列分别是：83为行数和列名
food_info.loc(83, "列名")

希望对大家有帮助