影视剧数据分析与可视化

12abxd

已于 2024-10-03 13:38:04 修改

阅读量1.5k

点赞数 14

分类专栏：数据分析文章标签：数据分析数据挖掘 Python jupyter

于 2024-09-16 07:00:00 首次发布

本文链接：https://blog.csdn.net/2301_80651329/article/details/142266942

版权

数据入口：影视剧数据集 - Heywhale.com

读取的数据包含750条条目，分布在6个列中。以下是数据的列和它们的数据类型：

影视剧名称（object）：表示影视剧的名称。

影视剧标签（object）：包含关于影视剧的标签信息，如类型、年份、主演等。

弹幕数量（object）：表示影视剧的弹幕数量，需要注意的是这一列的数据类型为 object，可能是因为数值前有单位（例如“万条弹幕”）。

热度（int64）：表示影视剧的热度，为一个整数数值。

关键词描述（object）：包含关于影视剧的关键词描述。

高清图片网址（object）：包含指向影视剧高清图片的网址。

一：数据预处理

数据概览如下：

首先读取数据，观察数据的大致情况：

import pandas as pd
# 读取上传的Excel文件
file_path = '影视剧信息.xlsx'
data_df = pd.read_excel(file_path)

data_df.info()

观测出“弹幕数量”有空值，所以可以去除含有空值的行：

# 删除含有空值的行
df1 = data_df.dropna(axis=0, how='any')
df1.info()

由于“弹幕数量”的单位存在不一致且“影视剧标签”含有多列，因此可以对这两列进行数据预处理。

由于大部分弹幕数量以万计，所以我们可以只提取含有“万条弹幕”的行，然后以“/”分隔符对影视剧标签进行分割：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

12abxd

关注关注

14
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数据分析案例-电影数据可视化分析

m0_64336780的博客

06-12

2万+

数据介绍数据为2011-2021电影数据可视化分析首先导入本次项目需要的包和数据数据预处理 可视化

数据分析案例- Netflix 电影和电视节目数据集可视化分析

m0_64336780的博客

03-13

1万+

本数据集来源于Kaggle，是 Netflix 电影和电视节目数据集，原始数据集共有8790条，10个变量，各变量含义如下：show_id：展出IDtype：内容（电视节目或电影）title：标题director：节目或电影的导演country：节目或电影的国家/地区date_added：添加到 Netflix 的日期release_year：内容发布年份rating：评级或限制duration：内容持续时间listed_in：内容类型。

参与评论您还未登录，请先登录后发表或查看评论

电影数据分析练习

12-20

数据来源：https://www.kaggle.com/damianpanek/sunday-eda/data 数据描述：2006年到2016年1000部最流行的电影数据报告分为：（1）提出问题（2）认识数据（3）清洗数据（4）分析数据（5）总结（一）提出问题（1）获取评分的平均分信息（2）分析导演信息（3）获取演员人数信息（4）查看电影时长(runtime)的分布情况（5）对电影上映时间进行分析（6）统计电影分类(genre)的情况（7）分析电影票房与哪些因素相关** （二）认识数据 1、首先导入相关的python数据分析的库 import pandas as p

电影数据分析（大数据分享）

weixin_38676040的博客

11-24

5098

1.导入包： %matplotlib inline import pandas as pd import matplotlib.pyplot as plt 2.导入用户数据; unames = ['user_id','gender','age','occupation','zip'] users=pd.read_table('ml-1m/users.dat',sep='::',header=No...

毕业设计-电影数据可视化分析（案例分析）

最新发布

VX_BYSJ8341的博客

11-09

2531

随着数字化时代的快速发展，电影产业也迎来了前所未有的繁荣。大量的电影数据背后隐藏着丰富的信息和价值，如何有效地对这些数据进行分析和可视化，成为了电影行业决策者和爱好者关注的焦点。基于Flask框架的电影数据可视化分析系统，旨在通过爬虫技术从各大电影网站获取电影数据，并结合数据库和可视化库对这些数据进行深入分析和展示，帮助用户更好地理解电影市场趋势、用户喜好以及电影评价等信息。通过该系统，用户可以直观地看到电影票房、评分、口碑等关键指标的变化，为电影投资决策、市场推广和观众选择提供有力支持。

数据分析电影

qq_38501057的博客

03-12

583

import pandas as pd import threading from pandas import Series import time start = time.perf_counter() unames = [‘user_id’, ‘gender’, ‘age’, ‘occupation’, ‘zip’] users = pd.read_table(‘users.dat’, sep...

netfix影视资源数据分析

guyuruo的专栏

06-22

1373

介绍 netfix影视资源项目主要通过Python进行数据预处理，分析netfix上发布电影、电视资源的对比情况，制作电影、电视最多的年份、国家，以及生成电影类型的词云图，影视资源的关联推荐等。导入库 import numpy as np import pandas as pd from pandas import Series,DataFrame import os import plotly.express as px from wordcloud import WordCloud, ...

数据可视化案例—基于影视数据的分析与可视化展示系统.zip

03-20

数据可视化是一种将复杂的数据集转化为易于理解的图形或图像表示的方法，它在IT行业中扮演着至关重要的角色，尤其是在大数据分析和决策制定过程中。本案例"数据可视化案例—基于影视数据的分析与可视化展示系统"是一...

基于Python的影视数据分析可视化系统电影电视剧数据分析(源码+lw+部署文档+讲解等)

专注于大学生项目实战开发,讲解,毕业答疑辅导,java就业辅导,高校老师/讲师/同行合作。以及产品测评宣传、工具推广等合作。全网粉丝10w+,平台优质创作者。

10-21

937

本课题专注于开发一个基于 Python 和 Django 的影视电影视频数据可视化系统。在影视行业日益繁荣的今天，对大量的影视数据进行有效分析和可视化展示具有重要意义。该系统利用 Python 的强大数据分析能力和 Django 的高效 Web 开发框架，为影视数据的管理和展示提供全面的解决方案。主要功能包括：一、数据采集与整理从多个数据源（如影视数据库、在线视频平台等）收集影视电影视频数据，包括电影名称、导演、演员、上映时间、票房、评分等信息。对采集到的数据进行清洗和整理，去除重复数据和错误数据，

电影数据电影数据电影数据

05-10

我们将在MovieLens(http://movielens.org)数据集上进行实验，在实验中，我们主要利用到的数据集中的两个文件u.data和u.item，其中u.item中记录的是电影的相关信息，u.data中主要是用户对电影的评分信息，评分的范围是1-5，文件的每一列分别表示用户ID，电影ID，评分，时间戳。

数据分析之电影类型数量分析

09-04

开始学习数据分析，常用的numpy，from matplotlib import pyplot as plt，pandas要找个实例用来巩固一下知识点，方便以后复习！

电影分类数据

02-06

康奈尔大学网站的2M影评数据集。配合教程http://blog.csdn.net/lsldd/article/details/41542107

电视剧数据集-电视节目和电影数据集（奈飞）

06-25

奈飞电视节目和电影其中15列信息，文件内包含属性详细说明，包括： ID title show type description release year age certification runtime genres production countries seasons IMDB ID IMDB Score TMDB Popularity

数据分析案例之电影推荐

a_step_further的博客

04-10

1万+

前言通过案例来学习数据分析的思路和练习相应分析工具，往往最有效的。本文用julia来进行全流程的探索和分析，以期达到既掌握分析思路，又练习了这一新兴的数据科学利器。同时，个性化推荐是个太大的topic，涉及的理论方法和实践非常多，本文有些地方会详细展开，有些则一笔带过。如无特殊说明，本文中所使用的code均为julia代码，IDE环境为JuliaPro.问题阐述个性化推荐是当今网络世界上普遍存在的...

基于大数据技术的影视作品排行榜数据分析与可视化设计论文

QQ1694456187的博客

06-01

1005

Django作为一个成熟的Web开发框架，提供了强大的功能和灵活性，能够满足影视作品排行榜数据分析与可视化的需求，Django提供的模板引擎和前端技术，也可以实现界面的友好性和易用性。因为影视作品排行榜数据分析与可视化涉及到大量的数据管理，本系统使用MySQL数据库管理系统，可以有效地存储和管理系统所需的数据，同样在开发过程中，考虑到了数据安全的问题，保障用户数据的机密性和完整性，因此，该应用系统有运行可行性。在应用系统的开发过程中，本系统选择了成熟且免费的软件和系统，无需额外的金钱投入。

Python数据分析案例12——网飞影视剧数据分析及其可视化