pandas学习与使用

pandas库

pandas是一个操作数据的一个库
以泰塔尼克号船员为例(数据集可以上github上下载)

  1. 读取数据集
titanic_surv=pd.read_csv("titanic_train.csv")
  1. 显示数据集的指定一列
age=titanic_surv["Age"]#显示年龄这一列
  1. 判断数据是否为null,null值为True,否则为False
age_is_null=pd.isnull(age)
age_is_null
显示出结果:
0      False
1      False
2      False
3      False
4      False
       ...  
886    False
887    False
888     True
889    False
890    False
Name: Age, Length: 891, dtype: bool

显示age值为null数据,age[age_is_null]中age_is_null的参数默认为true

age_null_true=age[age_is_null]
age_null_true

len()函数是统计数据的函数
查找age不为null,参数要写age_is_null=False

titanic_surv["Age"][age_is_null==False]
  1. 求平均数的几种方法,可以对比参照学习
age_mean=sum(age_null_false)/len(age_null_false)
age_mean
------------------------
titanic_surv["Age"][age_is_null==False].mean()
--------------------------
passenger_surv=titanic_surv.pivot_table(index="Pclass",values="Survived",aggfunc=np.mean)
passenger_surv
-------------------------------
passenger_age=titanic_surv.pivot_table(index="Pclass",values="Age")
passenger_age
#这个也是求平均数,与上一种比较aggfunc参数默认
  1. pivot_table()函数的使用
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值