【问题1】pandas的常用统计方法 (1)评分的平均分 rating_mean = df['Rating'].mean() (2)导演的人数 【方法1】 temp_list = df['Actors'].str.split(',').tolist() all_temp_list = [i for j in temp_list for i in j] nums = set(all_temp_list) len(nums) 【方法2】 temp_list = df['Director'].unique() # 自动生成列表,且列表里面无重复元素 len(temp_list) (3)电影时长的最大值,最小值 max_runtime = df['Runtime (Minutes)'].max() max_runtime_index = df['Runtime (Minutes)'].argmax() # 返回最大值所在的位置(axis=1,行 axis=0,列) min_runtime = df['Runtime (Minutes)'].min() min_runtime_index = df['Runtime (Minutes)'].argmin() # 返回最大值所在的位置(axis=1,行 axis=0,列) runtime_median = df['Runtime (Minutes)'].median() import pandas as pd df = pd.read_csv('./code2/datasets_IMDB-Movie-Data.csv') print(df.head(1)) print('*'*30) print(df.info()) # (1)获取平均得分 print("\n【df['Rating']】") print(df['Rating']) print( df['Rating'].mean() ) print('**(1)**'*10) # (2)导演的人数 ''' num_director = set( df['Director'].tolist() ) print(len(num_director)) # 644 ''' print( len(df['Director'].unique()) ) # df['Director'].unique()---- 自动生成列表,且列表里面无重复元素----注意:列表list没有unique函数 print('**(2)**'*10) # (3)获取演员的人数 temp_actor_list = df['Actors'].str.split(',').tolist()