本项目是针对一份电商数据采集|挖掘实战,干货满满,主要分为:
-
数据探索篇:多维度的统计可视化分析
-
用户画像篇:基于聚类算法和RFM模型的用户分层
-
关联规则篇:基于关联规则算法的商品种类关联性挖掘
下面为大家具体介绍下这个项目:
数据探索篇
数据探索篇主要是从统计可视化分析的角度出发,对数据有一个整体的了解;要做好数据的挖掘,首先我们要采集大量的电商数据,通常电子商务企业,跨境电商都要求稳定高效高并发的数据采集,这时候我们需要接入电商数据采集API接口实现。详细内容参考思维导图:
-
不同省份对比
-
不同时间段对比
-
消费金额和次数
-
消费周期
-
复购行为
-
使用pandas读取数据:需要特殊指定部分字段的类型
-
数据预处理
-
整体趋势分析
-
多维度对比
-
消费者不同购买行为
用户画像篇
用户画像篇主要是基于聚类算法和RFM模型来完成,主要内容:
-
如何多维度提取用户特征
-
特征工程:建模的必做工作
-
聚类算法的实施
-
RFM模型的实施
关联规则篇
关联规则主要是挖掘不同品牌和品牌种类的关联性信息:
详细代码请参考视频号内容: