项目简介
在全球新型冠状病毒肺炎疫情蔓延之际,世界各地的大部分人们还是选择纷纷相应国家号召,进行居家自我隔离,因此看电影便成为了人们日常娱乐休闲的热门选择之一。而随着时代的发展,在如今这个大数据时代背景下,本文便通过对知名数据网站 Kaggle 的 TMDB 5000 Movie Dataset 电影数据集(该数据集包含约 5000 部电影的相关数据)进行适当的数据分析,以此来探讨部分电影数据的可视化,尽可能让无论是观影者还是电影制作者都能更清楚、快速地掌握电影的各种数据,为电影事业后期的更好发展提供一定的数据支持,同时也希望可以通过本文中得出的对电影类型随时间变化趋势、统计电影分类情况、电影类型与利润的关系、Universal Pictures 和 Paramount Pictures 两家影视公司发行电影的数据对比情况、改编电影和原创电影的对比情况、电影时长与电影票房及评分的关系、电影关键词分析等内容的一些观点和结论,为今后电影事业的发展贡献自己的一份绵薄之力。
Python 电影 数据分析 可视化 TMDB
项目说明
本设计主要完成以下几个方面的内容:
- 读取数据;
- 数据处理:数据清洗;
- 数据分析及可视化操作:
①电影类型随时间变化趋势;
②统计电影分类情况;
③电影类型与利润的关系;
④Universal Pictures 和 Paramount Pictures 两家影视公司发行电影的数据对比情况;
⑤改编电影和原创电影的对比情况;
⑥电影时长与电影票房及评分的关系;
⑦电影关键词分析等。