次案例主要是对数据计算的应用。
如题,数据还是movie数据,分别通过以下指标分析导演和演员的盈利能力
1.计算导演的总票房gross,排名
2.计算导演的总利润gross-budget,排名
3.筛选出那些导演总利润是盈利的,那些导演的总利润是亏损的
4.imdb评分的分布情况
5.imdb平均分排名前二十导演
6.电影主演actor_1_name的总票房,排名
7.导演和电影主演的总票房,排名
一、计算导演的总票房gross,排名
df = pd.read_csv('movie_metadata.csv',
usecols=[0,1,2,3,4,5,6,7,8,9,10,11,13,15,27])
data=df.dropna(how='any')
data
#%%
data['profit']=data['gross'] - data['budget']
group_director_gross=data.groupby('director_name')['gross'].sum()/10000
group_director_gross.sort_values(ascending=False)
通过计算得出的seires可以看出来这些导演的票房都很高。
二、计算导演的总利润gross-budget,排名<