1. 项目背景
实现广告的精准投放就是最大化投入产出的过程,为此我们需要知道目标用户在哪里,在哪些渠道能最大化用户价值,以及各个渠道用户价值的变化规律。通过对渠道方式和渠道质量的追踪,以引流和转化率为关键事件,做好渠道的优化和维护。
本文通过研究阿里天池数据,仅从渠道、投放时间,投放人群,以点击率为数据指标进行数据分析,从而给出更好的方案和建议,实现高效率产出。
2. 数据来源
2.1 数据源
2.2 数据理解
表user_profile反映的是用户信息,表ad_feature反映的是广告属性信息,表raw_sample反映的书用户行为信息。本项目以浏览量和点击作为数据指标,进行数据分析。
3.分析思路
4. 数据准备
将数据源存储到MySQL数据库中,由于原始数据集过大,所以本项目只截取部分数据进行分析。截取思路是只分析总浏览量最高的广告对应的数据。
4.1 计算各个广告的浏览次数
按照广告ID字段对数据分组求和,将得到的总浏览量降序排列。
SELECT
adgroup_id,
COUNT(*) AS arise_count
FROM
raw_sample
GROUP BY
adgroup_id
ORDER BY
arise_count DESC;
4.2 选择子集
筛选广告ID总浏览次数最高的710164作为新的数据集建表
CREATE TABLE
IF
NOT EXISTS 710164_sample (
userid INT NOT NULL,
time_stamp VARCHAR ( 100 ) NOT NULL,
adgroup_id VARCHAR ( 20 ) DEFAULT NULL,
pid VARCHAR ( 100 ) DEFAULT NULL,
nonclk INT DEFAULT NUL