Pandas学习笔记1——Datawhale组队学习

【问题一】 Series和DataFrame有哪些常见属性和方法?
答:具体可见pandas官方API文档,也可以看这个博客Python Pandas之Series和DataFrame 的基本属性和方法
【问题二】 value_counts会统计缺失值吗?
答:不会
【问题三】 与idxmax和nlargest功能相反的是哪两组函数?
答:idxmin, nsmallest
【问题四】 在常用函数一节中,由于一些函数的功能比较简单,因此没有列入,现在将它们列在下面,请分别说明它们的用途并尝试使用。
sum/mean/median/mad/min/max/abs/std/var/quantile/cummax/cumsum/cumprod
答:具体解释可见python下的Pandas中DataFrame基本操作,基本函数整理
【问题五】 df.mean(axis=1)是什么意思?它与df.mean()的结果一样吗?第一问提到的函数也有axis参数吗?怎么使用?
答:关于axis=1或axis=0的解释可见Python数据分析中 DataFrame axis=0与axis=1的理解

【练习一】 现有一份关于美剧《权力的游戏》剧本的数据集,请解决以下问题:
(a)在所有的数据中,一共出现了多少人物?
答:564

gts=pd.read_csv('data/Game_of_Thrones_Script.csv')
gts['Name'].value_counts()

在这里插入图片描述
(b)以单元格计数(即简单把一个单元格视作一句),谁说了最多的话?
答:trrion lannister
(c)以单词计数,谁说了最多的单词?
答:talisa

n_index = gts.Sentence.str.len().sort_values(ascending=False).index
gts.reindex(n_index).head()

在这里插入图片描述

【练习二】现有一份关于科比的投篮数据集,请解决如下问题:(待解决)
(a)哪种action_type和combined_shot_type的组合是最多的?
(b)在所有被记录的game_id中,遭遇到最多的opponent是一个支?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值