第三章《数据分析实战》--第三章 python实现主要利用分组统计分析了企业某游戏的销售额下降的主要原因。
这一章主要利用交叉列表(或叫作透视表)的方式来剖析企业用户数量减少的原因。假设是因为某个群体的用户锐减导致当月用户比上个月的用户数少,因此主要利用python中的pandas、matplotlib模块完成书中分析。
1、读取数据、合并数据
首先将工作路径设置到数据文件所在位置,具体操作见第三章第一小节。
然后利用pandas来读取数据与合并数据。
1 importpandas as pd2
3 DAU_data = pd.read_csv(r'section4-dau.csv')4 User_info = pd.read_csv(r'section4-user_info.csv')5
6 data = DAU_data.merge(User_info, on=['user_id', 'app_name'])
利用 data.head()、data.tail() 合并后的前5行、后5行数据。
利用 data.info()查看数据的确实情况以及数据类型。