1 提出问题:如何实现广告的精准投放
实现广告的精准投放就是最大化投入产出的过程,需要知道我们的用户在哪里,在哪些渠道能够更大化用户价值,以及各个渠道用户价值的变化规律。通过对渠道方式和渠道质量的追踪,以引流和转化率为关键事件,做好渠道的优化和维护。
本文通过研究阿里天池数据,仅从渠道,投放时间,投放人群,以点击率为数据指标进行数据分析,从而给出更好的方案和建议,实现高效率高产出。如何评估渠道质量确定投放优先级
2 数据来源
2.1 数据源
2.2 数据理解
(1)user_profile.csv.tar.gz
(2)ad_feature.csv.tar.gz
(3)raw_sample.csv.tar.gz
表user_profile反映的是用户信息,表ad_feature反映的是广告属性信息,表raw_sample反映的是用户行为信息。数据集不存在投入产出字段,命题转化为以浏览量、点击率作为数据指标,进行数据分析。
3 分析思路广告投放数据分析
4 数据存储
将数据源存储在MYSQL数据库中,且变更数据存储空间大小。
4.1 计算各个广告的点击次数
由于数据量巨大,宕机时间长,选择部分数据分析,以下计算各个广告的点击次数。
-- 1 各个广告总点击次数SELECT raw_sample.adgroup_id, count(*) AS arise_count
FROM raw_sample
GROUP BY adgroup_id
ORDER BY arise_count DESC;
4.2 选择子集
筛选广告点击凑数最多的710164作为新的数据集建表
-- 2 新建表CREATE TABLE IF NOT EXISTS 710164_sample
(
userid INT NOT NULL,
time_stamp VARCHAR(100) NOT NULL,
adgroup_id VARCHAR(20) DEFAULT NULL,
pid VARCHAR(100) DEFAULT NULL,
nonclk VARCHAR(20) DEFAULT NULL,
clk VARCHAR(20) DEFAULT NULL
)engine=innodb default chars