kaggle数据分析入门之---视频游戏销售分析

本文通过kaggle的数据分析了游戏行业销售情况,包括游戏类型、平台、发行商的受欢迎程度以及各地区的销量变化趋势。发现动作类游戏、PS2平台和任天堂、EA是最受欢迎的,而北美和欧洲地区更偏爱动作和运动类游戏,日本则偏好角色扮演类。数据还显示销售额在2008年后呈现下滑趋势。
摘要由CSDN通过智能技术生成

1、明确分析需求

1.1数据介绍

项目介绍:由vgchartz.com的一个刮版生成的,有一份综合的游戏行业销售数据,希望产生一份综合的游戏行业报告
数据介绍:包含游戏名称、类型、发行时间、发布者以及在全球各地的销售额数据。
字段包括
RANK-总销售额的排名
Name-游戏的名字
Platform-游戏发布平台(即PC,PS4等)
Year-游戏发行的年份
Genre-游戏的类型
Publisher-游戏的出版者
NA_Sales -北美销售额(百万)
EU_Sales -欧洲销售额(百万)
JP_Sales -日本销售额(百万)
Other_Sales—世界其他地区销售额(百万)
Global_Sales—全球销售总额。
适用场景:电商、游戏销售,常规销售数据。

1.2明确分析思路

我们看到这些数据,到底有什么用呢,如何去分析呢?
首先明确目的:这批销售数据,我们用来干嘛,是分析游戏行业的发展趋势呢,还是分析各地区的销量,以及各游戏平台的发售情况等,这时需要结构化的去思考,去考虑,也就是数据分析最基础的部分。明确分析目的和思路,我们可以用思维导图的方式去思考。
在这里插入图片描述
目的:1.查看受欢迎的游戏类型、平台、发行商(前五名)
2.按地区,查看受欢迎的游戏类型、平台、发行商(前五名)
3.各地区销量变化趋势
4.各地区不同类型的游戏的销量变化趋势

好了接下来就让我们进行数据分析吧。

2.数据分析

2.1数据查看和清洗
import pandas as pd
import numpy as np

Sales_data = pd.read_csv('C:\\Users\\Administrator\\Desktop\\kaggle\\videogamesales\\vgsales.csv')
Sales_data.info() 
Sales_data

在这里插入图片描述
通过查看,Year-游戏发行的年份,Publisher-游戏的出版者两个字段有缺失,那我们再来判断一下哪些有缺失的。

Sales_data.isnull().sum()

在这里插入图片描述
可以看到Year缺失271个,Publisher-游戏的出版者缺失58个。考虑到相对总体,缺失的值比较小,我们采取直接删除的方式。

Sales_data_new=Sales_data_new.dropna()

2.2数据分析

1.查看受欢迎的游戏类型、平台、发行商(前五名)

# 1.查看受欢迎的游戏类型、平台、发行商(前五名) 
# 使用pandas数据透视表的功能:pivot_table()

# 获取游戏类型的排序
Genre_data = Sales_data_new.pivot_table(index = 'Genre',values='Global_Sales',aggfunc=np
  • 3
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值