pandas 数据处理练习题

在这里插入图片描述
在这里插入图片描述

import numpy as np
import pandas as pd
pd.set_option("max_columns",None) #显示所有列
# pd.set_option("max_rows",None) #显示所有行
df=pd.read_csv("nobel.csv")
print(df)
print(df.info())
#找出诺贝尔得奖者做多的国家
print(df.groupby("birth_country")["year"].count().sort_values(ascending=False))
print(df["birth_country"].value_counts().head(20))
#诺贝尔奖得奖者获得最多的国家哪一年的奖项最多
print(df[df["birth_country"] == "United States of America"]["year"].value_counts().head(10))
#诺贝尔奖得奖者获得最多的国家哪个年代的奖项最多
df["年代"]=df["year"]//10*10
print(df[df["birth_country"] == "United States of America"]["年代"].value_counts())
#诺贝尔奖获得者获得最多的国家什么奖项最多
print(df[df["birth_country"] == "United States of America"]["prize"].value_counts())
#查找中国获得哪些奖项,降序排列
print(df[df["birth_country"] == "China"]["prize"].value_counts())
import numpy as np
import pandas as pd
pd.set_option("max_columns",None) #显示所有列
# pd.set_option("max_rows",None) #显示所有行
df=pd.read_csv("nobel.csv")
print(df)
print(df.info())
#找出诺贝尔奖中女性的比例
print(df["sex"].value_counts()["Female"] / df["year"].count())
#找出不同奖项的平均获奖年龄
print(df.groupby("category")["age"].mean().astype(int))
#统计不同世纪不同国家得奖者的数量
df["世纪"]=df["year"]//100+1
print(df.groupby(["世纪", "death_country"])["year"].count())
#统计中国获奖者的平均年龄
df["birth_date"]=pd.to_datetime(df["birth_date"])
df["death_date"]=pd.to_datetime(df["death_date"])
df["年龄"]=df["death_date"].dt.year-df["birth_date"].dt.year
print(df["年龄"])
print(df[df["birth_country"] == "China"]["年龄"].mean().astype(int))
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值