目录
warning:为了方便画图把表格导出以后用excel画的 画完图以后保存再打开没了 才发现没注意导出的都是csv格式存不住图🌿
数据描述
数据集:https://www.kaggle.com/gregorut/videogamesales/data
该数据集为销售量超过100,000个的视频游戏排名
字段:
Rank - Ranking of overall sales 总销售额排名
Name - The games name 游戏名称
Platform - Platform of the games release (i.e. PC,PS4, etc.) 发布平台
Year - Year of the game's release 发布年份
Genre - Genre of the game 游戏类型
Publisher - Publisher of the game 发行商
NA_Sales - Sales in North America (in millions) 北美销售额
EU_Sales - Sales in Europe (in millions) 欧洲销售额
JP_Sales - Sales in Japan (in millions) 日本销售额
Other_Sales - Sales in the rest of the world (in millions) 其他地区销售额
Global_Sales - Total worldwide sales. 全球总销售额
分析维度:游戏 平台 发行商 地域
1、游戏类型年份趋势 游戏销售额年份趋势 游戏数量发布年份趋势
2、top平台总销售额 top平台游戏类型数量趋势 top平台地域市场份额
3、top发行商总销售额 top发行商游戏类型趋势 top发行商地域市场份额
4、地域销售额趋势 地域游戏类型趋势
5、预测销售额 总体发展趋势
data.describe(include = 'object')
共有11493个不同游戏,31个平台,12种游戏类型,578个发行商
数据分析
游戏
游戏类型年份趋势
按年份分类后取出每年销量最高的游戏类型
game1grouped = game1.groupby('Year').apply(lambda x: x[x.Global_Sales==x.Global_Sales.max()])
2001年起 action游戏类型占绝对主流 且销量较之前有较大提高
但在2013年后 虽然仍为销量最高的游戏类型 但销量逐年减少
2018、2019年都没有视频游戏超过10w销售额(也可能是数据有所缺失)
在2017年和2020年 role-playing和simulation取而代之
游戏类型近年趋势
game2 = data[data['Year'].isin(['2014','2015','2016','2017','2020'])]
game2 = game2.groupby(['Year','Genre'])['NA_Sales','EU_Sales','JP_Sales','Other_Sales',