计算广告学--笔记(1)

内容来自师徒网:刘鹏--计算广告学


计算广告核心问题和挑战

广告中的计算问题:Find the best match between a given user u, in a given context c, and s suitable ad a.


从优化角度来看

-特征提取:受众定向. 把u和c打上标签的过程

-微观优化:CTR预测. 投是按照ecpm来投

-宏观优化:竞价市场机制

-受限优化:在线分配

-强化学习:探索与利用。试的过程是探索,优化的过程是利用

-个性化重定向:推荐技术


从系统角度来看:

-候选查选:实时索引。新的广告能很快上线,超预算的广告能很快的下线

-特征存储:No-sql技术

-离线学习:Hadoop

-在线学习:流计算。如上一个搜索词是什么

-交易市场:实时竞价


在线广告计算的主要挑战

大规模

-百万量级的页面,十亿量级的用户,需要被分析处理

-高并发在线投放系统(几乎是最高的)

-latency的严格要求。如Ad exchange要求竞价在100ms内返回

动态性

-用户的关注和购物兴趣非常快速的变化。

丰富的查询信息

-需要把用户和上下文中多样的信号一起用于检索广告候选

探索与发现

-用户反馈数据局限于在以往投放中出现的(a,u,c)组合,需要主动探索未观察到的领域,以提高模型正确性


在线广告系统的ROI:

eCPM=CTR*CPC*1000


搜索、广告与推荐的比较

 搜索 搜索广告 显示广告 推荐 
首要准则 相关性投资回报率投资回报率用户兴趣 
其他需求各垂直领域独立定义质量、安全性质量、安全性多样性,新鲜度
索引规模十亿级百万级--千万级百万级百万级-亿级
个性化较少的个性化需求较少的个性化需求亿级用户规模上的个性化亿级用户规模上的个性化
检索信号较为集中较为集中较为丰富较为丰富
DownStream优化不适用不适用不适用适用


在线广告系统结构

在线部分:

-高并发投送系统。十毫秒级别的实时决策,百亿次/天的广告投放系统

离线部分:

-受众定向平台。灵活的海量数据挖掘平台。前沿机器学习算法的分布式架构

数据高速公路:内部及外部TB级数据实时收集处理。快速给线上系统反馈,另以方便给BI人员分析。

流式计算平台:日志的准实时挖掘和反馈,反作弊和计价


在线广告系统模块

1.Ad serving  来自用户和来自ad exchange的ad call

2.Ad retrieval

3.Ad ranking

4.Stream computing

5.Data highway

6.Session log generation 根据用户的search、browse的信息做targeting,基础性日志. 应用:Data warehouse/BI, audience targeting, CTR/eCPM预测模型

7.Data warehouse

8.Customized audience segmentation

9.Page attributes system

10. Audience targeting

11. Ad management system




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值