Video Game Sales电子游戏销售分析
- 定义问题:
-
特征分析:
- 1.游戏平台分析
- 2.游戏类型分析
- 3.地区对比
-
预测分析:
- 未来的销售趋势预测
# 导包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pyecharts import options as opts
from pyecharts.charts import Pie
from pyecharts import options as opts
from pyecharts.charts import Bar
plt.style.use('seaborn')
plt.rcParams['font.sans-serif']=['Simhei'] #显示中文,解决图中无法显示中文的问题
plt.rcParams['axes.unicode_minus']=False #设置显示中文后,负号显示受影响。解决坐标轴上乱码问题
数据清洗
# 导入数据
data = pd.read_csv("vgsales.csv")
# 查看数据结构,发现Year,Publisher等项是有空值的
print("行数 : ", data.shape[0])
print("列数 : ", data.shape[1])
print("\n特征数量 : \n", data.columns.tolist())
print("\n缺失值 : \n", data.isnull().sum())
print("\n唯一值 : \n", data.nunique())
行数 : 16598
列数 : 11
特征数量 :
['Rank', 'Name', 'Platform', 'Year', 'Genre', 'Publisher', 'NA_Sales', 'EU_Sales', 'JP_Sales', 'Other_Sales', 'Global_Sales']
缺失值 :
Rank 0
Name 0
Platform 0
Year 271
Genre 0
Publisher 58
NA_Sales 0
EU_Sales 0
JP_Sales 0
Other_Sales 0