Pandas文件读取常用的数据操作方法

Pandas文件读取常用的数据操作方法

本篇博客是接着上篇博客python数据分析处理库-Pandas数据读取、索引与计算

import pandas
food_info = pandas.read_csv("food_info.csv") #读取与本python文件同一目录下的food_info.csv文件
food_info.sort_values("列名", inplace=True) #对文件该列进行排序,inplace=True表示排序后覆盖此列
                                             (默认从小到大排序)
food_info.sort_values("列名", inplace=True,ascending=False) #同上,区别是从大到小排序

-----除去列中的为空NaN(NaN)的元素
lie = food_info["列名"]
lie.loc[0:10] #切片方式查看前10个元素
lie_is_null = pandas.isnull(lie) #查看该列为空(NaN)的所有元素,是空的返回true,不空返回false
lie_null_true = lie[lie_is_null] #查看该列为空(NaN)的所有元素,当然返回都是NaN
len(lie_null_true) #查看该列为空(NaN)的元素有多少个
lie_not_null = food_info["列名"].[lie_is_null == False] #查看该列不为空(NaN)的所有元素

food_info["列名"].mean() #求该列的平均值

-----以列名1为索引,将列名1中相同的元素对应的列名2中的值加起来求平均值,默认是aggfunc=np.mean
food_info.pivot_table(index="列名1", values="列名2", aggfunc=np.mean)

-----以列名1为索引,将列名1中相同的元素对应的列名2和列名3中的值加起来分别求和
food_info.pivot_table(index="列名1", values=["列名2", "列名3"], aggfunc=np.sum)

-----将列名1和列名2中为空(NaN)的丢掉
food_info.dropna(axis=0, subset=["列名1", "列名2"])

-----定位到某个元素,行列分别是:83为行数和列名
food_info.loc(83, "列名")

希望对大家有帮助

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值