提起大数据与机器学习,绕不开的就是“点击率预估”问题,这是由于广告的日志信息天然具有大量有标记信息。在这里,基于以往的工作,我对点击率预估的背景与技术背景进行概述。更进一步的文章留待后续更新。
在开始之前,这里也对广告业界常用的名词例如CTR、策略、算法进行说明。
名词定义:
CTR(Click-Through-Rate):点击率
Bid:广告主对广告的竞价
Price:广告系统对广告主的扣费
策略&模型&算法:
策略:可以实现目标的方案&方法
模型:基于数据、结合已有的知识和经验来建模
算法:给定模型假设空间,基于观察数据求解模型
一、广告:互联网最重要的盈利模式之一。
2014年BAT广告收入
2014年财报 |
市值(3.18) |
14年收入 |
14年盈利 |
Q4广告收入占比 |
阿里巴巴 |
2123.6亿(美元) |
525.04亿(RMB) |
234.03亿 |
almost 100% |
腾讯 |
1641.95亿(美元) |
789.32亿(RMB) |
238.16亿元(RMB) |
12.52% |
百度 |
711.02亿(美元) |
490.52亿(RMB) |
131.87亿(RMB) |
almost 100% |
上图是我检索到的BAT2014广告收入占比,可以看到在BAT三强中,除了大腾讯是以”游戏“为主要收入来源以外,百度与阿里巴巴主要依靠广告进行盈利,因此可以说是广告撑起我国互联网半壁江山。(果然也是如此,google,facebook也主要依靠搜索广告与社交广告进行盈利,对应着我国的百度与腾讯广点通社交广告).