原作:面包包包包包包
修改:寒小阳 && 龙心尘
时间:2016年1月
出处:
http://blog.csdn.net/breada/article/details/50572914
http://blog.csdn.net/han_xiaoyang/article/details/50580423
http://blog.csdn.net/longxinchen_ml/article/details/50580647
声明:版权所有,转载请联系作者并注明出处
1. 引言
提笔写这篇博客,我的内心是惶恐的。原因很简单,作为一个资历尚浅的研究生,是没有资格对计算广告这样一个伟大的行业、领域和学科来评头论足的。之所以这么做,一是总结自己已掌握的知识,二是降低同学们的学习成本。本人能力有限,更缺乏实践经验,文章内容多为书籍和论文的读后感,若有不当或者错误之处,还望各位同学指出,我定悉心求教。在此,向编写《计算广告》的刘鹏和王超两位老师致谢,向各位paper作者致谢。
[关于ML学分计划]
- 由寒小阳和龙心尘发起,一个互帮互助的机器学习知识共享平台。
- 我们是一群对机器学习感兴趣的小伙伴,对于神奇的机器学习经常有“一探究竟”的冲动,却因为孤身一人学习的寂寞、亦或繁忙考试工作之余的小小拖延症,而没有持续这份对知识的渴求和热情。
- 由于深感类似情况的小伙伴之多,我们希望建立一个“ML学分计划”——机器学习的学习和分享计划——来帮助我们一起更高效地学习、更集中地整理分享我们的知识和经验。因为我们也深信”证明自己真的透彻理解一个知识,最好的方法,是给一个不熟悉这个内容的人,讲清楚这个内容“。
[关于原作@面包包包包包包]
- 海淀区明光村计算机职业技术学院,研二学生。
- 关注计算广告点击率预估和竞价算法,关注机器学习和深度学习,初学者。
(上)(下)全文目录
广告=>互联网广告
:“您好,了解一下”互联网广告=>计算广告
:指哪儿打哪儿!计算广告主要的四种形式
:谁在弄潮?计算广告关键技术
:这孙子怎么什么都知道?广告系统架构
:要啥自行车,这里有宝马。手把手系列之教你搭建一个最小广告系统
:mieSys
2. 广告 => 互联网广告
“同学您好,了解一下!”宿舍楼下站着一位小姑娘,怀里捧着一沓宣传单,正在熟练的向每位路过的同学发放着。我伸手接过一张,冲她点了一下头以示友好。我一看是“撑了么”,不禁感叹O2O的钱是真多啊!按照已往经验,这波过后下一波不是“品碑”就是“美因”了。不对,不会是美因,好久不见什么动静了,应该就是品碑没错。没走两步,顺手把传单塞进了垃圾桶,脑海中还在推演着餐饮O2O的格局和未来。作为一个互联网人,每天这么关心行业发展,说实话还真的有点累呢。
广告对于我们每一个人来说都不陌生,甚至早已成为我们生活中非常重要的组成部分。无论我们再怎么厌恶它,屏蔽它,都不妨碍它在不同时间和不同地点,以不同的形式频频与我们相遇。世界上脸皮最厚的东西是什么,不是城墙角,而是广告。但是,你真的那么恨广告吗?恐怕也不是。想想你买过的吃穿用,是不是都是你熟悉的品牌呢,你是否还记得你与这些品牌的初次相遇呢?接下来,我就要开始认真的扯犊子了。
2.1.广告三要素
一句话解释广告:这个牌子我好像在哪里见过呢。
广告,是一项商业活动。说白了,就是广告主出钱让你看广告。哎呦喂,居然有人这么惦记着我,想想还有点小激动。想要完成一次广告展示,以下三要素必不可少:
- 广告主:出钱让你看广告的那个人
- 用户:你
- 媒介:传单、广播、杂志、公共展位、报纸、电视和互联网等传播途径。
这三者之间的关系是博弈的,听起来好高端的样子。研究博弈的主要原因还是为了你好我好大家好,具体如下:
- 广告主 vs 用户:
广告主有做广告的需求,为的就是进行品牌宣传,在用户的脑海中静悄悄地种下一颗种子,在用户挑选同类商品时大声喊出“选我选我选我”。用户有了解品牌的需求,这样在挑选商品时才能选择出最适合自己的那一款。
- 广告主 vs 媒介:
广告主为了让广告能够传播的更广泛,就有选择合适媒介的需求,是印传单,还是投电视,哪个投入回报比最高就选哪个?媒介有发布广告的需求,因为这样可以通过出租广告位来获得收入,养活一家老小,还有那群可爱的程序员。
- 用户 vs 媒介:
我们用户为了实现人生价值,都有收集信息,了解外部世界的需求。途径无非就是读书看报、电视上网,这是刚需,无关情怀。媒介有吸引用户的需求,因为用户来了,用户的注意力就来了,广告主也就跟着来了。
2.2 广告 => 互联网广告
一句话解释互联网广告:在互联网上做的广告,效果可衡量,广告主再也不用担心钱花的不明不白啦!
上面我们简单介绍了一下广告的背景知识,说白了就是三方各有需求,也各取所需,一个愿打一个愿挨,你好我好大家好。下面我们要开始介绍互联网广告了。
什么叫互联网广告呢?就是在互联网上做的广告。嗯…就是这么简单。再多说一些,其实是广告的媒介发生了变化。以前广告主要都在电视上做,是因为在那个年代用户的消遣方式比较单一,把时间都花在了看电视上。但是现在看电视的人少了,上网的人多了,广告主说:“我的小祖宗诶,你就看一眼吧”,于是广告就追着用户,做到了互联网上。
“自从广告上了互联网,广告的面貌就焕然一新。”造成行业巨变的原因,是因为互联网广告的效果可以被衡量。
回到本文最开始的“撑了么”传单。广告主只知道一共印了多少张传单,都交给谁去发,在哪个地方发,但是不可能知道是谁接到了这张传单,接到的人有没有看,看的人有没有买。这对广告主来说,我把钱花了,却不知道谁买了,有点不明不白,求广告主心理阴影面积。但是这钱不花还不行,这是传统广告面临的最大问题,即广告效果无法衡量。
那互联网广告是如何解决这个问题的呢?很简单,通过网站的日志系统。通过对用户上网HTTP请求的解析,网站可以得到当前时间、访问用户的IP地址、用户的操作系统和浏览器版本等基本信息,如下图。
这里,三列分别是这些用户在本站的cookie值(用来唯一识别本站的用户)、IP和访问时间。
更多的,通过脚本或者其他方式,网站可以对用户在本站的浏览行为进行记录,比如监控用户的点击行为、鼠标停留区域和停留时间等。如果用户点击的内容是广告,那么这个点击信息就会被后台数据库,如下图。