商务与经济统计案例分析:3-2电影业——python 实现

商务与经济统计案例分析:3-3亚太地区的商学院

要求

1.四个变量中每个变量的描述统计量,接着对每个描述统计量得出关于电影业的情况进行讨论
2.如果有,哪些电影被认为是优异表现的异常值,请解释。
3.列出总票房收入与每一个其他变量之间关系的描述统计量,请解释。

Python实现

1.四个变量中每个变量的描述统计量,接着每个描述统计量得出的关于电影业的情况进行讨论。

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

data = pd.read_csv('F:\DataAnalysis\StatisticForBusinessAndEconomics\Movie\\2011Movies.csv')
data['Number of Theaters']=data['Number of Theaters'].str.replace(",","").astype('int64')

data.describe()

在这里插入图片描述
相关描述性统计的分析可查看:2-2电影业

2.如果有,哪些电影被认为是优异表现的异常值,请解释。

下面是以四分位数的方式查找异常优秀的电影:

首先从票房角度:

#首映票房
Q1=data['Opening Gross Sales ($millions)'].quantile(q=0.25)#计算下四分位数
Q3=data['Opening Gross Sales ($millions)'].quantile(q=0.75)#计算上四分位数

#基于1.5倍的四分位数差计算上下限对应的值
up_limit=Q3+1.5*(Q3-Q1) #上限值
low_limit=Q1-1.5*(Q3-Q1) #下限值
Value_error=data[(data['Opening Gross Sales ($millions)']>up_limit)]
Value_error

在这里插入图片描述

#总票房
Q1=data['Total Gross Sales ($millions)'].quantile(q=0.25)#计算下四分位数
Q3=data['Total Gross Sales ($millions)'].quantile(q=0.75)#计算上四分位数

#基于1.5倍的四分位数差计算上下限对应的值
up_limit=Q3+1.5*(Q3-Q1) #上限值
low_limit=Q1-1.5*(Q3-Q1) #下限值
Value_error=data[(data['Total Gross Sales ($millions)']>up_limit)]
Value_error

在这里插入图片描述
从票房角度来看:Harry Potter and the Deathly Hallows Part 2 、Transformers: Dark of the Moon、The Twilight Saga: Breaking Dawn Part 1、The Hangover Part II、Pirates of the Caribbean: On Stranger Tides、Fast Five共6部电影不仅是首映票房还是总票房都异常高于其他电影。

Q1=data['Weeks in Release'].quantile(q=0.25)#计算下四分位数
Q3=data['Weeks in Release'].quantile(q=0.75)#计算上四分位数

#基于1.5倍的四分位数差计算上下限对应的值
up_limit=Q3+1.5*(Q3-Q1) #上限值
low_limit=Q1-1.5*(Q3-Q1) #下限值
Value_error=data[(data['Weeks in Release']>up_limit)]
Value_error

3.列出总票房收入与每一个其他变量之间关系的描述统计量,请解释。

X = np.stack((data['Total Gross Sales ($millions)'], data['Opening Gross Sales ($millions)'],data['Weeks in Release'],data['Number of Theaters']), axis=0)# 每一行作为一个变量
np.corrcoef(X)

在这里插入图片描述
通过计算皮尔逊相关系数可知,总票房数与首映票房数呈强正相关,其次与电影剧院数也呈正相关,与放映周数成弱正相关。这个数据刚好也验证了2-2案例-电影业中得到的结论。

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值