基于python分析广告投放转化情况

该数据为网上公开脱敏数据,从广告展示到最终付费转化的全过程。


前言

数据来源:
kaggle

广告转化率、付费率、哪些广告转化率高,哪些特征的用户转化率高、哪些广告转化率高但付费率低,进而优化广告的投放策略。


数据分析流程步骤:
1.提出问题–>2.理解数据–>3.清洗数据并建立模型–>结论

一、提出问题

在这里插入图片描述

二、理解数据

在这里插入图片描述

三、清洗数据并建立模型

数据处理流程:
选择子集对应列–>列名重命名–>重复值处理–>空值处理–>一致化处理–>排序–>异常值处理–>特征工程–>建立模型

好的废话不多说,先上结果(这是第一种结果呈现的方式):

第一种

问题一,转化率是否与性别有关系?

在这里插入图片描述

问题二, 转化率是否与年龄段有关?

在这里插入图片描述

问题三, 转化率是否与爱好有关?

在这里插入图片描述

问题四, 展示次数、点击次数、咨询次数和付费次数的相关性怎样?

在这里插入图片描述

第二种

以下是第二种结果呈现的方式

1.选择子集对应列

import pandas as pd

data = pd.read_csv(r'data.csv',sep=',',header='infer')
# 选择子集(对应列)
choose_column_name= data[['ad_id','age','gender','interest','Impressions','Clicks','Spent','Total_Conversion','Approved_Conversion']]
choose_column_name.head(10)

在这里插入图片描述

2.列名重命名

rename_column = {
   
    "ad_id" : "广告ID",
    "age" : "年龄",
    "gender" : "性别",
    "interest" : "兴趣",
    "Impressions" : "展示次数",
    "Clicks" : "点击次数",
    "Spent" : "花费",
    "Total_Conversion" : "咨询次数",
    "Approved_Conversion" : "付费次数",
}
choose_column_name.rename(columns = rename_column,inplace = True)
choose_column_name.head(10)

在这里插入图片描述

3.重复值处理

choose_column_name.drop_duplicates().count()

在这里插入图片描述
操作后没有发现由重复值。

4.空值处理

choose_column_name.isnull().count()

在这里插入图片描述
没有空值所以不需要处理

5.一致化处理

choose_column_name.dtypes

在这里插入图片描述
类型不用处理

6.排序

choose_column_name.sort_values(by ="花费",ascending = True) 

在这里插入图片描述
对花费排序,没有发现异常值

7.异常值处理-看看描述性统计

choose_column_name.describe()

在这里插入图片描述
没有发现类似花费是负数等异常值

8.对兴趣列进行特征提取

interest_df = pd.DataFrame()
interest_df = pd.get_dummies(choose_column_name['兴趣'],prefix = 'interest')
interest_df.head()

在这里插入图片描述

choose_column_name = pd.concat([choose_column_name,interest_df],axis = 1)
choose_column_name.head()

在这里插入图片描述

9.对年龄进行特征提取

age_df = pd.DataFrame()
age_df = pd.get_dummies(choose_column_name['年龄'],prefix = 'Age')
age_df.head()

在这里插入图片描述

choose_column_name = pd.concat([choose_column_name,age_df],axis = 1)
choose_column_name.head()

在这里插入图片描述

10.建立模型

展示次数

# 建立模型
# 展示次数
# choose_column_name["展示次数"].sum()
"{0} {1} {2}".format("展现量:",choose_column_name["展示次数"].sum(),"(次)")
# 点击次数
# choose_column_name["点击次数"].sum()
"{0} {1} {2}".format("点击次数:",choose_column_name["点击次数"].sum(),"(次)")
# 咨询次数
# choose_column_name["咨询次数"].sum()
"{0} {1} {2}".format("咨询次数:",choose_column_name["咨询次数"].sum(),"(次)")
# 付费次数
# choose_column_name["付费次数"].sum()
"{0} {1:d} {2}".format("付费次数:",<
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值