用pandas分析电影评分与票房的关系

使用Jupyter的API,pandas和matplotlib。pandas进行数据获取,生成dataframe矩阵,matplotlib进行画图。最终得到电影评分与票房的关系。
数据库包括了1000条电影信息,代码如下:

import pandas as pd
import matplotlib.pyplot as plt
from pylab import mpl   #设置字体
mpl.rcParams["font.sans-serif"] = ["SimHei"]
mpl.rcParams["axes.unicode_minus"]=False  
data = pd.read_csv("E:\\IMDB-Movie-Data.csv")  #导入数据
plt.figure(figsize=(20,8),dpi=100)   #设置画布尺寸
dataframe=data.sort_values(by='Metascore')   #按评分排序
x = dataframe["Metascore"]    #设置x坐标轴
y = dataframe["Revenue (Millions)"]    #设置y坐标轴
plt.plot(x,y)  #绘制折线图
plt.xlabel("评分")
plt.ylabel("票房")
plt.grid(True,linestyle="--",alpha=1)    #画网格
plt.title("评分与票房关系图",fontsize=20)   #图像标题
plt.savefig("./count.png")   #保存图像
plt.show()          #显示图像

结果演示:

折线图
在这里插入图片描述
在这里插入图片描述
结果分析:可以看出评分极低和极高的票房都不尽如人意,而高票房电影集中在60-80分,说明大部分人的审美观点是统一的。人们对于烂片肯定抵触,但高评分的好片票房却也不高,因此从侧面证明一部成功的商业片必有瑕疵;那种不食人间烟火的高质量文艺片,还要靠人们的文化审美水平提升去补救啊!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值