3 ---- pandas统计方法（pandas）

最新推荐文章于 2024-03-18 21:58:46 发布

qq_44647559

最新推荐文章于 2024-03-18 21:58:46 发布

阅读量99

点赞数

分类专栏： 3 python三大库（已完结）

本文链接：https://blog.csdn.net/qq_44647559/article/details/116586436

版权

【问题1】pandas的常用统计方法
（1）评分的平均分
rating_mean = df['Rating'].mean()



（2）导演的人数
【方法1】
temp_list = df['Actors'].str.split（','）.tolist()
all_temp_list = [i for j in temp_list for i in j]
nums = set（all_temp_list）
len(nums)
【方法2】
temp_list = df['Director'].unique()      # 自动生成列表，且列表里面无重复元素
len(temp_list)



（3）电影时长的最大值，最小值
max_runtime = df['Runtime (Minutes)'].max()
max_runtime_index = df['Runtime (Minutes)'].argmax()   # 返回最大值所在的位置（axis=1，行    axis=0，列）
min_runtime = df['Runtime (Minutes)'].min()
min_runtime_index = df['Runtime (Minutes)'].argmin()   # 返回最大值所在的位置（axis=1，行    axis=0，列）
runtime_median = df['Runtime (Minutes)'].median()

import pandas as pd



df = pd.read_csv('./code2/datasets_IMDB-Movie-Data.csv')
print(df.head(1))
print('*'*30)
print(df.info())




# （1）获取平均得分
print("\n【df['Rating']】")
print(df['Rating'])
print( df['Rating'].mean() )
print('**（1）**'*10)




# （2）导演的人数
'''
num_director = set( df['Director'].tolist() )
print(len(num_director))                 # 644
'''
print( len(df['Director'].unique()) )    # df['Director'].unique()---- 自动生成列表，且列表里面无重复元素----注意：列表list没有unique函数
print('**（2）**'*10)





# （3）获取演员的人数
temp_actor_list = df['Actors'].str.split(',').tolist()

最低0.47元/天解锁文章

qq_44647559

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3 ---- pandas统计方法（pandas）

【问题1】pandas的常用统计方法（1）评分的平均分rating_mean = df['Rating'].mean()（2）导演的人数【方法1】temp_list = df['Actors'].str.split（','）.tolist()all_temp_list = [i for j in temp_list for i in j]nums = set（all_temp_list）len(nums)【方法2】temp_list = df['Director'].unique(
复制链接

扫一扫