一.任务理解
张三,护肤品及彩妆类卖家,几经打拼,信用积累到皇冠,但也累得半死,每日深陷护肤品行业的红海鏖战之中。感觉现在淘宝上的竞争越来越激烈,爆款可以带来销量,却带不来多少利润。促销、聚划算之类的活动做来做去,最后却发现钱都被开平台的马老板给挣走了。焦虑中的张三迫切想得到自家店铺的下面两点信息:
(1) 如果下次再做会员促销,究竟哪些是最有可能对促销信息作出反馈的会员?即他应当优先考虑对哪些会员进行促销?
(2) 和在本店铺无重购行为的买家相比,在本店铺有重购行为的买家具有怎样的特征?
(3)你可以为张三提供更多的有益分析结果。
二、数据理解(记录实验步骤、分析实验结果)
2.1、属性名含义理解
读入源数据sav文件后,以表格输出查看结果。如下图2.1-1和图2.1-2
(交易表)图2.1-1
(买家表)图2.1-2
交易表中共有7个基本字段,17517条记录,分别为
1. basket_id 表示买单号,连续型数据。
2. buyer_id 表示买家ID。
3. goods_id表示商品ID。
4. pur_time表示购买时间。
5. price是总价。
6. shipcost是运费。
7. cases是商品数。
买家表中共有7个基本字段,14635条记录,分别为
1. buyer_id是买家ID。
2. buy_gender是乘客父母与小孩个数,连续型数据。