淘宝广告数据分析实战!(附代码和100W数据源)

本文通过分析淘宝广告数据,探讨了广告价格、类别、性别和用户群体对点击率的影响。研究发现,低价广告商品点击率较高,尤其是100元以下的价格区间。在类别4385中,男性用户点击率较低,主要受30岁以上男性用户欢迎。此外,女性用户对广告的点击人数总体上多于男性,但点击率相似。通过K-Means聚类和RFM模型,将用户分为5类,建议优先服务高价值用户,提高广告转化率。
摘要由CSDN通过智能技术生成

在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。本文主要针对“点击率”这一因素进行分析,与大家分享。

本文为Rambo同学原创投稿,以项目分析的架构,从多维度展开分析。全文共4000+字,建议收藏。

相关数据源和代码已经打包整理好,后台回复“广告数据“即可获取。

P1  分析背景及目的


这是一份淘宝平台的广告展示/点击数据,本次分析需要从这些数据中发现某些规律或者异常,进而给运营团队提出建议。


评价一个广告效果的指标就是广告的点击人数,可以反映一个广告有多少人愿意点击查看广告的内容,只有广告被点击,后续转化为购买行为才会发生。


把广告的点击人数指标拆分:


广告点击人数=广告展示数 x 点击率


而广告展示数又由广告商品的价格、类别影响;不同人群对不同类别商品有着不同的喜好,从而影响广告的点击率。


在广告展示数一定的条件下,点击率的高低就是决定一个广告能否被更多人看到的因素。


因此本次分析就针对【点击率】这一因素进行分析

P2  分析思路

从“广告”和“用户”两个角度进行分析:

1.广告角度


  • 分析不同广告的商品价格对点击率的影响

  • 分析哪些类别的广告点击率更高,哪些类别的点击率低

2.用户角度

  • 分析性别和广告点击率有什么关系

  • 结合聚类分析与RFM模型分析用户群体对广告点击率有什么关系

P3  分析过程

  数据清洗



1、数据概览

原始的数据集中包括三类数据,具体数据对应属性如下:

为了方便分析,抽取其中的部分字段作为分析。
从raw_sample数据集中抽取:用户ID、广告ID、是否点击
从ad_feature数据集中抽取:广告ID、类目ID、广告商品价格
从user_profile数据集中抽取:用户ID、年龄层、性别、购物层次

2、数据组合

将三张数据表,组合到一张表中

a=raw_sample.merge(right=ad_feature,on='ad_id',how='left')
b=a.merge(right=user_profile,on='user_id',how='left')

得到一张记录了用户-广告信息表


3、缺失值处理

3.1 源数据中还有许多的缺失值,将性别和年龄层字段中为空值的记录删去

3.2 异常值处理
查看广告商品价格字段的属性值范围:

评论 43
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值