2、 在产品运营过程中,对用户行为的数据进行收集、存储、跟踪、分析与应用等,可以找到实现用户自增长的存在的问题、群体特征与目标用户。
三、分析思路
==========
-
主要从以下四个维度对用户行为进行分析和建议:
-
1、用户的行为习惯分析:利用pv、uv等指标,分析用户活跃的时间段和趣事,熟悉用户行为的时间模式;
-
2、用户的行为转换情况分析:通过采用漏斗模型从单击浏览到支付购买的各个阶段对用户行为进行分析,确定各个环节的流失率,并提出相应的改善建议;
-
3、用户偏好分析:根据商品的点击、收藏、加购、购买频率,探索用户对商品的购买偏好,制定对不同商品、不同用户之间的营销策略;
-
4、核心用户分析:找出最具有价值的核心用户群,考虑针对该群体的营销策略,针对这个群体用户行为推送个性化推送,优惠券等。
四、数据清洗
-
首先该数据是在多个文件下的CSV文件,通过递归对文件夹内所有文件进行查询,并合并了所有的指定文件,具体的操作步骤大家可以看Python遍历目录下的所有文件、读取、千万条数据合并详解这篇文章,里边详细的写了如何遍历所有文件夹,如何组合,如何批量的打开文件目录下的所有文件,并对多文件下的文件进行合并,本文就不再赘述数据合并的过程了,直接采用合并后的数据,大家不懂可以看我的以上两盘博客,写的很详细。
-
1、读取查看数据的基本信息和数据的完整性
data=final_data
data.head()
查看一下我们合并后表格的情况,可以发现目前表格的列数为7列
-
其中’Unnamed: 0’,‘user_geohash’(有缺失)两列数据我们在分析时不涉及,对这两列数据进行删除。
import pandas as pd
final_data.drop([‘Unnamed: 0’,‘user_geohash’],axis=1,inplace=True)
final_data.head()
成功进行删除,检查数据类型
data.dtypes