电影分析案例-电影时长直方图(2021/07/25)

本文通过分析电影时长,展示了电影时间长短的分布情况,利用数据绘制了一张直方图。数据清洗后,仅使用电影时长一列进行统计,设置合适的组数以完成直方图的绘制,帮助理解电影时长的分布趋势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如题,我们要分析电影时间长短的分布情况,绘制直方图展示。这张图的思路比较特殊,可以作为一个例子。

还是使用之前的数据,读取并清洗数据。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt


df = pd.read_csv('movie_metadata.csv',
                 usecols=[0,1,2,3,4,5,6,7,8,9,10,11,13,15,27])
data=df.dropna(how='any')

绘制 电影时长-电影个数 的直方图我们只需要用到电影时长一列数据。

绘制直方图用 数据、组数 两个参数

# movie_duration=data['duration']也可以写成
movie_duration=data.duration

plt.figure(figsize=(20,8),dpi=100)
# 设置组距
distance = 5
group_num=int((max(movie_duration)-min(movie_duration))/distance)
# 计算组数
# 绘制直方图用 数据、组数 两个参数
plt.hist(movie_duration,bins=group_num)

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
plt.xticks(range(int(min(movie_duration)),int(max(movie_duration)))[::5])
plt.grid(linestyle&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值