一、项目分析
1. 项目背景
A/B测试常用于比较不同设计、运营方案的优劣,以辅助决策。本分析以支付宝营销活动为例,利用Python,通过广告点击率指标比较两组营销策略的广告投放效果。
2. 数据概览及处理
本项目所用数据集来自阿里云天池 Audience Expansion Dataset:
其中effect_tb.csv(广告点击情况数据集)数据包含支付宝中的两个商业定向广告系列日志。
数据中 dmp_id:营销策略编号 1:对照组,2:营销策略一,3:营销策略二
user_id:支付宝用户ID
label:用户当天是否点击活动广告(0:未点击,1:点击)
2.1 数据处理
df = pd.read_csv('effect_tb.csv',
header=None,
names=['dt','user_id','label','dmp_id'])
df.head()
2.1.1 删除无用列
日志天数属性用不上,删除该列
df = df .drop(columns = "dt")
df .head()
2.1.2 数据信息
print("*"*20,'基本信息')
print(df.info())
print("*"*20,'空值')
print(df.isnull().sum())
print("*"*20,'重复值')
print(df.duplicated().value_counts())
******************** 基本信息
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2645958 entries, 0 to 2645957
Data columns (total 3 columns):
user_id int64
label int64
dmp_id int64
dtypes: int64(3)
memory usage: 60.6