python数据分析与应用实训第四章_《数据分析实战》--第四章 python实现

第三章《数据分析实战》--第三章 python实现主要利用分组统计分析了企业某游戏的销售额下降的主要原因。

这一章主要利用交叉列表(或叫作透视表)的方式来剖析企业用户数量减少的原因。假设是因为某个群体的用户锐减导致当月用户比上个月的用户数少,因此主要利用python中的pandas、matplotlib模块完成书中分析。

1、读取数据、合并数据

首先将工作路径设置到数据文件所在位置,具体操作见第三章第一小节。

然后利用pandas来读取数据与合并数据。

1 importpandas as pd2

3 DAU_data = pd.read_csv(r'section4-dau.csv')4 User_info = pd.read_csv(r'section4-user_info.csv')5

6 data = DAU_data.merge(User_info, on=['user_id', 'app_name'])

利用 data.head()、data.tail() 合并后的前5行、后5行数据。

1515651-20190516131145917-2004702273.png

1515651-20190516131221417-244530965.png

利用 data.info()查看数据的确实情况以及数据类型。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值