流媒体平台影视数据分析(数据预处理与可视化)

本文通过分析包含100年影片信息和四大流媒体平台数据,探讨了选择订阅平台的依据。数据预处理涉及删除无用列、处理缺失值和异常值。分析发现,影片质量与数量并重,Prime Video影片数量领先,但高分电影占比与其他平台相当。年龄限制18+的影片中,Hulu占比最高。不同平台对各类电影的偏好各异,喜剧片和动作片高分较多。此外,近十年制作出大量高质量电影,美国制作高分电影最多。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景介绍

相信大家在选择订阅流媒体平台时一定都会有一个疑问🤔️ :到底选择订阅哪一个平台可以观看到更多质量更高的影片呢?又或者我偏爱某一类型的电影我该选择哪一家流媒体平台订阅呢?

为了解决这个问题,我选取了一个包含近100年发行的超过一万部影片的相关信息及Netflix,Hulu,Prime Video,Disney+四家流媒体平台的放映信息的数据包。

                                                                                                                         

 

作为一个电影爱好者解决了首要问题之后我当然还会进行一些发散性数据分析:比如哪个国家制作了最多高分电影?哪个类型的电影平均得分最高?哪一年发行了最多影片?

看到这里如果有同为电影爱好者的读者可以先猜想一下答案

 

下面是该数据包中包含的字段以及对各字段的解释:

ID:每部影片独特的ID

Title:每部影片的标题

Year:影片发行年份

Age:年龄限制,如7+,13+等

IMDb:IMDb(互联网电影数据库)得分

Rotten Tomatoes:烂番茄得分

Netflix:是否在Netflix放映

Hulu:是否在Hulu放映

Prime Video:是否在Prime Video放映

Disney+:是否在Disney+放映

Type:影视剧或电影(0为电影,1为影视剧)

Genres:影片类型

Country:在哪个国家制作

Language:语言类型

Runtime:总时长

 

数据预处理

通过观察原始数据集的排列我发现Unnamed:0这一列没有提供任何有用信息可以直接删除。

按照惯例拿到数据集先查看数据

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值