计算广告学是一门由信息科学、统计学、计算机科学以及微观经济学等学科交叉融合的新兴分支学科。前MediaV首席科学家、前Yahoo!高级科学家刘鹏开设计算广告学(Computational Advertising)公开课。课程地址:
http://study.163.com/course/introduction.htm?courseId=321007#/courseDetail
第二章:合约广告系统
第一节:常用广告系统开源工具
该课程的目标是把每一种产品形态的问题讲述清楚,再介绍核心的算法和关键性的工具。
Hadoop:目前主流的大数据存储和计算平台(Google有其自己的平台)。核心项目:HDFS;MapReduce。
两种脚本语言:Pig(不需要对数据进行加工,更直接),Hive。
离线数据处理工具:
Hbase; BigTable(google),HYPERTABLE,Cassandra(facebook),这几个是用于解决大数据上半结构化存储的工具。
Oozie:
在线数据处理工具:
ZooKeeper(常用):分布式环境下解决一致性问题的开源的解决方案。可以看做Chubby(Google)的简化版本。
Avro(不常用)--Thrift(Facebook,用于取代Avro)
S4(Yahoo)--Storm(Twitter,流式计算平台)
Chuhwa--Scribe(facebook):分布式的日志收集工具;
Elephant-bird(Twitter):配合Pig使用
Thrift比较有用,推荐用它去关注逻辑层的东西
接口可以向下兼容
第二节 合约广告简介
课程目标:知道合约广告系统究竟在解决什么问题?
传统媒体购买方式:直接媒体购买(direct media buy),离线广告的做法,在线广告刚产生时也是这么操作的。
Guaranteed Delivery,GD 担保式投送:量在合约中会明确写明,未完成则需赔偿
量优先于质的销售方式
Guaranteed Delivery付费方式多采用千次展示付费(Cost per Mille,CPM)方式结算,多以品牌广告商为主
广告投放机(Ad server):CPM要对不同的人群投送不同的广告,所以要求投送由服务器完成
点击率预测CTR,流量预测,受众定向(人群划分后才能去算)