个性化系统框架
计算广告是根据个体用户信息投送个性化内容的典型系统之一。在介绍计算广告系统的架构之前,先看看一般的个性化系统是如何构成的。
由4个主题部分构成:
- 用于实时响应请求,完成决策的在线投放引擎;
- 离线的分布式计算数据处理平台;
- 用于在线实时反馈的流计算平台;
- 连接和运转以上3部分数据流的数据高速公路。
协作流程是:在线投放系统的日志接入数据高速公路,再由数据高速公路快速转运到离线数据处理平台和在线流计算平台;离线数据处理平台周期性地以批处理方式加工过去一段时间的数据,得到人群标签和其他模型参数,存放在缓存中,供在线投放系统决策时使用;与此相对应,在线流计算平台则负责处理最近一小段时间的数据,得到准实时的用户标签和其他模型参数,也放到缓存中,供在线投放系统决策时使用,这些是对离线处理结果的即时补充和调整。
各种个性化系统之间有共性,但由于其数据来源、产品形态、优化目标的不同,系统架构的细节也会呈现很大的区别。在Web规模问题上的区别是决定系统架构不同的关键原因。
各类广告系统优化目标
广告系统的优化目标是提高广告产品的利润:
任何一个具体的计算广告系统,都是为了优化上面的目标而设计的。对应于个性化系统一般框架,在广告系统中,每次展示的r是由在线的投放引擎来决策的,离线数据处理平台和流计算平台所做的,都是为了准备 a i , u i , c i a_i,u_i,c_i