1 第1章 Pandas基础

1.5.2 2. 练习
1.5.2.1 【练习一】 现有一份关于美剧《权力的游戏》剧本的数据集,请解决以下问题:
1.5.2.2 (a)在所有的数据中,一共出现了多少人物?
df = pd.read_csv(‘data/Game_of_Thrones_Script.csv’)
df.head()
df[‘Name’].nunique()
1.5.2.3 (b)以单元格计数(即简单把一个单元格视作一句),谁说了最多的话?
df[‘Name’].value_counts().index[0]
1.5.2.4 (c)以单词计数,谁说了最多的单词?
df_words = df.assign(Words=df[‘Sentence’].apply(lambda x:len(x.split()))).sort_values(by=‘Name’)
df_words.head()

L_count = []
N_words = list(zip(df_words[‘Name’],df_words[‘Words’]))
for i in N_words:
if i == N_words[0]:
L_count.append(i[1])
last = i[0]
else:
L_count.append(L_count[-1]+i[1] if i[0]==last else i[1])
last = i[0]
df_words[‘Count’]=L_count
df_words[‘Name’][df_words[‘Count’].idxmax()]

1.5.2.5 【练习二】现有一份关于科比的投篮数据集,请解决如下问题:
1.5.2.6 (a)哪种action_type和combined_shot_type的组合是最多的?
df = pd.read_csv(‘data/Kobe_data.csv’,index_col=‘shot_id’)
df.head()
pd.Series(list(zip(df[‘action_type’],df[‘combined_shot_type’]))).value_counts().index[0]
1.5.2.7 (b)在所有被记录的game_id中,遭遇到最多的opponent是一个支?
pd.Series(list(list(zip(*(pd.Series(list(zip(df[‘game_id’],df[‘opponent’])))
.unique()).tolist()))[1])).value_counts().index[0]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值