作者:LogM
本文原载于 https://segmentfault.com/u/logm/articles,不允许转载~
文章中的数学公式若无法正确显示,请参见:正确显示数学公式的小技巧
本文是 计算广告(第二版)
的读书笔记。
该部分介绍在线广告的关键技术,面向技术人员。
第9章 计算广告技术概览
9.1 个性化系统框架
- 日志 -> 数据高速公路 -> 流计算 -> 在线特征 -> 投放引擎;
- 日志 -> 数据高速公路 -> 分布式计算 -> 离线特征 -> 投放引擎。
9.2 各类广告系统优化目标
- GD:满足合约要求;
- ADN:CPC,预估点击率;
- ADX:CPM;
- DSP:预估点击率+点击价值。
9.3 计算广告系统架构
-
广告投放引擎:
- 广告投放机(ad server):召回+排序+收益管理,要求QPS和延迟;
- 检索(ad retrieval):根据用户标签和页面标签,召回候选集;
- 排序(ad ranking):计算eCPM,估计点击率+点击价值,排序;
- 收益管理(yield management):目标全局收益最优;
- 广告请求接口:web请求或者SDK;
- 定制化用户划分:广告主对用户的划分数据。
- 数据高速公路(data highway)
-
离线数据处理:
- 用户会话日志生成:以用户ID进行统一整理;
- 行为定向:挖掘用户日志,打标签;
- 上下文定向:给上下文页面打标签;
- 点击率建模:为CTR模型加工特征;
- 分配规划:以全局收益最优为目标,从日志中挖掘合适的分配方案;
- 商业智能系统:为决策者提供数据(BI);
- 广告管理系统:广告主工具(AE),管理投放方案。
-
在线数据处理:
- 在线反作弊:去除作弊流量;
- 计费;
- 在线行为反馈:实时受众定向、实时点击反馈;
- 实时索引:实时接收广告数据,更新索引。
9.4 计算广告系统主要技术
-
算法优化:
- 受众定向;
- eCPM预估,点击率预测;
- 在线分配(合约中的流量要求);
- 定价策略:博弈中收益最大化;