python数据分析可视化项目——游戏销售量


数据来源

本项目数据来源于kaggle数据集,地址https://www.kaggle.com/datasets/gregorut/videogamesales, 大小390kb。

  • 数据指标包括:
    • Rank - 销售量排名
    • Name - 游戏名称
    • Platform - 游玩平台
    • Year - 发行年份
    • Genre - 游戏类型
    • Publisher - 出版商
    • NA_Sales - 北美销售量millions
    • EU_Sales - 欧洲销售量millions
    • JP_Sales - 日本销售量millions
    • Other_Sales - 其他地区销售量millions
    • Global_Sales - 总销售量

可视化

数据准备

import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('data\\vgsales.csv',)

print(data.columns)
print(data.head(5))

游戏出版年份和销量统计——折线图

# 按年份分组、排序
data = data.groupby("Year")
data = data.sum().sort_values("Year",ascending=False)

print(data.head(5))

fig = plt.figure()
ax1 = fig.add_subplot(111)
ax1.plot(data.index,data["Global_Sales"],color="black",label="Global_Sales")
ax1.plot(data.index,data["NA_Sales"],color="blue",alpha=0.9,label="NA_Sales")#透明度
ax1.plot(data.index,data["EU_Sales"],color="yellow",label='EU_Sales')
ax1.plot(data.index,data["JP_Sales"],color="pink",label="JP_Sales")

ax1.set_xlabel("发行年份")
ax1.set_ylabel("销售量")

ax1.legend()

plt.savefig('image/mplot.png')
plt.show()

mploy.png

lst_genre = list(set(data["Genre"].values))
print(lst_genre)

data = data.groupby(["Year","Genre"]).sum()
print(type(data))
print(data.head(5))
data = data.reset_index()

fig, axrr = plt.subplots(3,4)
ax1 = axrr[0][0]

print(type(ax1))
print(data.head(50))

for i in range(3):
    for j in range(4):
        ax = axrr[i][j]
        ax.plot(data[data["Genre"]==lst_genre[i+j]]["Year"],
                 data[data["Genre"]==lst_genre[i+j]]["Global_Sales"],
                label=lst_genre[i+j])
        ax.set_xlabel("Year")
        ax.set_ylabel("Global_Sales")
        ax.legend(loc='upper left')

fig.suptitle("游戏类型的销售量时间曲线")

在这里插入图片描述

游戏类型、出版商、游玩平台销量统计——柱形图

dataPla = data.groupby("Platform")
dataPla = dataPla.sum().sort_values("Global_Sales",ascending=False)
# dataPla = dataPla[dataPla['Global_Sales']>100]
dataPla = dataPla[:10]

dataPub = data.groupby("Publisher")
dataPub = dataPub.sum().sort_values("Global_Sales",ascending=False)
dataPub = dataPub[dataPub['Global_Sales']>100]
dataPub = dataPub[:10]

dataGen = data.groupby("Genre")
dataGen = dataGen.sum().sort_values("Global_Sales",ascending=False)
dataGen = dataGen[:10]

print(data.head(5))

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

fig = plt.figure()
ax1 = fig.add_subplot(311)
ax2 = fig.add_subplot(312)
ax3 = fig.add_subplot(313)

ax1.bar(dataPla.index,dataPla['Global_Sales'])
ax2.bar(dataPub.index,dataPub['Global_Sales'])
ax3.bar(dataGen.index,dataGen['Global_Sales'])

在这里插入图片描述

游戏类型比例——饼图

plt.pie(dataGen['Global_Sales'],labels=dataGen.index,autopct="%.3f%%")
plt.savefig('image/mpie.png')

在这里插入图片描述
先做这些 ——2022.6.11


  • 4
    点赞
  • 64
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
Python数据分析可视化项目是指使用Python编程语言进行数据分析可视化项目。这些项目通常涉及收集、清洗、处理和分析数据,并使用图表、图形和可视化工具来展示数据的结果和趋势。 以下是一个示例的Python数据分析可视化项目分析的步骤: 1. 收集数据:从各种来源(例如数据库、API、文件)收集数据,并将其存储在适当的数据结构中,如列表、字典或数据框。 2. 清洗数据:对数据进行清洗,包括处理缺失值、异常值和重复值,以及转换数据类型和格式。 3. 数据处理和分析:使用Python数据处理库(如Pandas)进行数据处理和分析。这包括计算统计指标、创建新的变量和特征,以及应用各种数据转换和操作。 4. 数据可视化:使用Python可视化库(如Matplotlib、Seaborn或Plotly)创建图表、图形和可视化工具,以展示数据的结果和趋势。这可以包括柱状图、折线图、散点图、热力图等。 5. 解释和报告:解释数据分析的结果,并将其编写成报告或演示文稿,以便与他人分享。 以下是一个示例代码,展示如何使用Python进行数据分析可视化: ```python import pandas as pd import matplotlib.pyplot as plt # 读取数据 data = pd.read_csv('data.csv') # 数据清洗和处理 # ... # 数据分析 # ... # 数据可视化 plt.plot(data['x'], data['y']) plt.xlabel('X') plt.ylabel('Y') plt.title('Data Visualization') plt.show() ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值