import pandas as pd #加载数据 def read_data(file_root): dataframe=pd.read_csv(file_root) print("数据的基本信息:") print(dataframe.info()) print("数据的行是%i,列是%i"%(dataframe.shape[0],dataframe.shape[1])) print("数据预览:") print(dataframe.head()) return dataframe #处理缺失数据 def processing_missing_data(dataframe): if dataframe.isnull().values.any(): dataframe=dataframe.dropna() return dataframe #分析票房数据 def analyze_data(dataframe,groupby_attribution): grouped_data=dataframe.groupby(groupby_attribution,as_index=False)["gross"].sum() sorted_grouped_data=grouped_data.sort_values(by="gross",ascending=False) sorted_grouped_data.to_csv("H:/pythonfigure/gross.csv",index=None) #重新构造电影类型 def reget_data(dataframe): df_genres=pd.DataFrame(columns=["genre","budget","gross","year"]) for i, row in dataframe.iterrows():
电影票房案例分析
最新推荐文章于 2021-07-25 23:37:32 发布
该博客主要介绍了对电影票房数据的分析过程。首先,通过`read_data`函数读取数据并展示基本信息;接着,处理缺失数据,使用`dropna`去除含有空值的行;然后,通过对数据按指定属性分组,计算票房总和,并将结果保存到csv文件;最后,通过`reget_data`函数重新构造电影类型数据,并将处理后的数据保存。整个过程展示了数据预处理和基础数据分析的方法。
摘要由CSDN通过智能技术生成