【实战】支付宝营销策略——ABtest

数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=50893

由于隐私问题,数据脱敏。

三个数据集:

  • effect_tb.csv: 广告点击情况数据集
  • emb_tb_2.csv: 用户特征数据集
  • seed_cand_tb.csv: 用户类型数据集

使用字段:

  • dmp_id:营销策略编号(设置1为对照组,2为营销策略一,3为营销策略二)
  • user_id:支付宝用户ID
  • label:用户当天是否点击活动广告(0:未点击,1:点击)

 一、数据预处理

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

from IPython.core.interactiveshell import InteractiveShell   #多行输出
InteractiveShell.ast_node_interactivity = "all" 

 (一)查看缺失值、重复值

data=pd.read_csv("C:/Users/ZJDCUser/Desktop/比赛实战/支付宝营销策略分析/effect_tb.csv",header=None)
data.columns=['dt','user_id','label','dmp_id']  #文件中没有字段名
#日志天数属性用不上,删除该列
data=data.drop(columns='dt')
data
data.info()   #三列均不存在缺失值

 

user_id label dmp_id
0 1 0 1
1 1000004 0 1
2 1000004 0 2
3 1000006 0 1
4 1000006 0 3
... ... ... ...
2645953 999966 0 1
2645954 999971 0 1
2645955 99999 0 2
2645956 999990 0 1
2645957 999992 1 1

2645958 rows × 3 columns

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2645958 entries, 0 to 2645957
  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值