电影票房案例分析

最新推荐文章于 2021-07-25 23:37:32 发布

Rivertao

最新推荐文章于 2021-07-25 23:37:32 发布

阅读量1.7k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/weixin_41789633/article/details/81712037

版权

该博客主要介绍了对电影票房数据的分析过程。首先，通过`read_data`函数读取数据并展示基本信息；接着，处理缺失数据，使用`dropna`去除含有空值的行；然后，通过对数据按指定属性分组，计算票房总和，并将结果保存到csv文件；最后，通过`reget_data`函数重新构造电影类型数据，并将处理后的数据保存。整个过程展示了数据预处理和基础数据分析的方法。

摘要由CSDN通过智能技术生成

import pandas as pd
#加载数据
def read_data(file_root):
    dataframe=pd.read_csv(file_root)
    print("数据的基本信息：")
    print(dataframe.info())
    print("数据的行是%i,列是%i"%(dataframe.shape[0],dataframe.shape[1]))
    print("数据预览：")
    print(dataframe.head())
    return dataframe
#处理缺失数据
def processing_missing_data(dataframe):
    if dataframe.isnull().values.any():
        dataframe=dataframe.dropna()
        return dataframe
#分析票房数据
def analyze_data(dataframe,groupby_attribution):
    grouped_data=dataframe.groupby(groupby_attribution,as_index=False)["gross"].sum()
    sorted_grouped_data=grouped_data.sort_values(by="gross",ascending=False)
    sorted_grouped_data.to_csv("H:/pythonfigure/gross.csv",index=None)
#重新构造电影类型
def reget_data(dataframe):
    df_genres=pd.DataFrame(columns=["genre","budget","gross","year"])
    for i, row in dataframe.iterrows():