Python之电子游戏销售数据Seaborn可视化笔记

本文通过Python的Seaborn库,展示如何分析并可视化电子游戏销售数据,包括年度销售总额、游戏发布数量及各出版商的销售表现。通过数据清洗、缺失值处理,创建了柱状图、条形图和散点图,揭示了游戏行业的销售趋势和出版商的业绩。同时,提供了代码解释,适合Python和Seaborn初学者学习。
摘要由CSDN通过智能技术生成

这个笔记是in R:https://www.kaggle.com/umeshnarayanappa/explore-video-games-sales中的作品启发的。
笔记的目标是尽可能简单地实现在上面的R笔记本中创建的可视化,使用Python以及一些附加的情节,并添加了一些评论和解释,以帮助Seborn/Python初学者他们的数据可视化/自定义。我们通过玩不同的颜色来保持事物的趣味性。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
Matplotlib is building the font cache using fc-list. This may take a moment.

使用熊猫在数据集中阅读。我们看到每一行条目对应于特定的游戏,数据包含游戏的名称、发布的年份以及一些分类特征,如平台、类型和发行者。最后,我们看到,游戏(行)条目还包括累计销售所取得的,按区域,按该特定的游戏。

df = pd.read_csv("/home/kesci/input/Datasets6073/vgsales.csv")
df.head()
Rank Name Platform Year Genre Publisher NA_Sales EU_Sales JP_Sales Other_Sales Global_Sales
0 1 Wii Sports Wii 2006.0 Sports Nintendo 41.49 29.02 3.77 8.46 82.74
1 2 Super Mario Bros. NES 1985.0 Platform Nintendo 29.08 3.58 6.81 0.77 40.24
2 3 Mario Kart Wii Wii 2008.0 Racing Nintendo 15.85 12.88 3.79 3.31 35.82
3 4 Wii Sports Resort Wii 2009.0 Sports Nintendo 15.75 11.01 3.28 2.96 33.00
4 5 Pokemon Red/Pokemon Blue GB 1996.0 Role-Playing Nintendo 11.27 8.89 10.22 1.00 31.37

检查最大年值,我们看到它是2020年,这是一个不可能的发布日期。

year_data = df['Year']
print("Max Year Value: ", year_data.max())
Max Year Value:  2020.0

通过错误年份查看条目的名称,我们可以在网上搜索游戏的发布日期,并将当前值替换为正确的发布日期。

max_entry = year_data.idxmax()
print(max_entry)
max_entry = df.iloc[max_entry]
pd.DataFrame(max_entry).T
5957
Rank Name Platform Year Genre Publisher NA_Sales EU_Sales JP_Sales Other_Sales Global_Sales
5957 5959 Imagine: Makeup Artist DS 2020 Simulation Ubisoft 0.27 0 0 0.02 0.29
df['Year'] = df['Year'].replace(2020.0, 2009.0)
print("Max Year Value: ", year_data.max())
Max Year Value:  2017.0
  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
Python数据分析与可视化数据科学领域中常用的工具之一。它提供了丰富的库和方法,用于处理和分析各种类型的数据,并通过图表和可视化展示数据结果。 在进行数据分析时,Python提供了Pandas和NumPy等强大的库,用于处理和清洗数据。Pandas提供了DataFrame和Series等数据结构,可以方便地操作和查询数据。NumPy提供了各种数学函数和矩阵等工具,可以进行高效的数值计算。 在数据分析的基础上,Python还提供了诸如Matplotlib、Seaborn和Plotly等库,用于数据可视化。这些库提供了丰富的图表类型,可以用于展示和传达数据的信息。Matplotlib是Python最常用的绘图库之一,提供了各种绘图函数和方法,使用户可以自定义图表的样式和排版。Seaborn是基于Matplotlib的高级绘图库,专注于统计可视化,提供了丰富的统计图表类型和配色方案。Plotly是一种交互式绘图库,可以生成高质量的图表,并支持与用户的交互。 通过Python数据分析与可视化,用户可以从数据中提取有价值的信息。比如,可以进行数据聚合和汇总,计算统计指标,发现数据的规律和趋势。同时,数据可视化也可以帮助用户更直观地理解和解释数据,从而更好地支持决策和沟通。 总之,Python数据分析与可视化提供了强大的工具和方法,用于对各种类型的数据进行处理、分析和可视化。它能够帮助用户更深入地理解数据,从中发现价值,并将结果以直观的形式展示出来。无论是在学术研究、商业分析还是日常工作中,Python数据分析与可视化都是一种有力的工具。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值