pandas常用的方法大全

用法及解释如下所示

import pandas as pd
from pymongo import MongoClient
import numpy as np
#读取csv文件
# h=pd.read_csv("C:/Users/lenovo/Desktop/en.csv")
# print(h)


#pands读取mongodb
client=MongoClient()
collection=client["user"]["user"]
data=collection.find({},{"age":1,"name":1})


data2=collection.find()
#print(list(data))
t1=pd.DataFrame(data2)

#dateframe 排序
#print(t1.sort_values(by="age",ascending=False))#降序
t2=t1.sort_values(by="age",ascending=False)

#dateframe 取行或列
#写数组 表示取行
#写字符 表示取列
#print(t2[:3])#取前三行
#print(t2["name"])#取name列


#dataframe 切片
#loc取的是标签名
#取行标签为2和1,列标签为name和age
#print(t2.loc[[2,1],["name","age"]])
#取行标签为2,列标签为name
#print(t2.loc[2,"name"])

#iloc取的是第几行 第几列
#print(t2.iloc[[1,0],[2,1]])


#可以直接赋值为NaN
# t2.iloc[1,2]=np.NaN
# print(t2)


#布尔索引,条件可以用&或|隔开
#print(t2[(t2["age"]>22)&(t2["age"]<24)])

#输出是为NaN
#print(t2.isnull())
#输出不为NaN
#print(t2.notnull())

#输出age不为0的行
#print(t2[pd.notnull(t2["age"])])



#处理缺失数据的两种方法
#1 删除NaN所在的行或列(axis为0代表行,为1代表列,how为any是有NaN即删除,how为all是该行或列全为NaN才删除
# inplace为True代表在原来的基础上进行修改。为Flase代表在修改后生成一个新的)
#print(t2.dropna(axis=0,how="any",inplace=True))

#2 填充数据
#print(t2.fillna(22))#把NaN填充为22
print(t2["age"].fillna(t2["age"].mean()))#把t2年龄这一列为NaN的替换为该列的平均值(注意:mean方法在计算时不会把NaN计算在内)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值