互联网广告系统综述八机器学习与数据

互联网广告系统综述八机器学习与数据 写好标题,却迟迟不知道怎么动手,最近机器学习的一个分支——深度学习,真是火得没朋友啊,过去十几年的最热门的核方法,被成功的放到一边去了,整个工业界开始重新聚焦到神经网络这边来了。 方法万能论总是那么让人热血沸腾的。 可惜经过一段时间的摸爬滚打,脑子总算清醒...

2014-11-09 00:04:48

阅读数 4690

评论数 9

互联网广告系统综述七特征

互联网广告系统综述七特征 描述完系统,模型等方面,就到了花费互联网广告算法工程师的最大精力的点了,就是特征工程,这是一个持久战斗的点。 流程复杂,而且各种机器学习的方法都可以在这里用上,有效果,有产出,有指标。当然,玩砸的也不少,打击总是很多的。 前面那么多的工作,都可以在系统搭建完成后,变...

2014-11-08 23:58:23

阅读数 7027

评论数 3

互联网广告系统综述六模型

互联网广告系统综述六模型 经过几个博文的啰啰嗦嗦,又是业务又是定向又是系统架构的,给各位的感觉都是在描述一些外围的东西,真正核心的东西还没说到。对于心急得如干柴烈火的热血青年来说,似乎一直在各种前戏,一直没感受到提抢上阵的快感。 就算这么急,这还是得说——在广告算法领域,如果说ctr预估是包子...

2014-11-08 23:48:25

阅读数 3956

评论数 2

互联网广告系统综述五系统架构

互联网广告系统综述五系统架构   前面几篇博文都说了很多业务架构方面的东西,顺便说了一些用户基础信息的挖掘相关的事情。那些很多都已经被大神们说得淋漓尽致了,除了定向中说的那几个定向方法以外。 下面就开始一些跟技术相关的东西了。 1.1 前言 在说了这么多技术无关的东西后,是要来点有技术...

2014-11-08 23:35:17

阅读数 6270

评论数 1

互联网广告系统综述四定向

互联网广告系统综述四定向 所谓定向,就是广告算法工程师提供给广告主一些用户属性与条件,供广告主用来找到自己的目标人群的。 定向是很重要的,在古代,一个买大饼的武大郎,想必不会把大饼担挑到几十公里见不到人的戈壁滩去吆喝。一个卖草帽的老板,也不会跑到青楼一条街去吆喝。定向就是广告主选择自己的目标人...

2014-11-08 23:30:56

阅读数 3642

评论数 1

互联网广告系统综述三业务描述

互联网广告系统综述三业务描述 前面说了互联网广告市场发展的一些现状,其中提到了品牌广告和效果广告,也提到了广告平台中涉及的三个利益相关方广告主,用户,广告平台老板。 由于本文是利用广告平台的工程师的视角描述的,就聊聊广告平台上的利益相关方的博弈吧。 当然,要注意的是,效果广告才有这三方博弈,...

2014-11-08 23:13:34

阅读数 2699

评论数 0

互联网广告系统综述二业务背景

互联网广告系统综述二业务背景 广告一直是无处不在的,在古代,武大郎挑着他的大饼,在街上大喊:“卖大饼咧,又大又圆的大饼啊,只卖一文钱!”这也是做广告的一种方式。 到了现代更加多了,电视放到关键时刻,总要来点广告。 互联网兴起后,哪里都有了广告了。 一. 背景 1.1 前言 最近几年,机...

2014-11-08 22:41:35

阅读数 3853

评论数 0

LDA入门级学习笔记

LDA入门级学习笔记

2014-09-14 14:25:55

阅读数 14277

评论数 3

EM算法学习笔记

一.EM算法解决的问题 要了解EM算法,就先了解这个算法是干啥的,十大算法之一头衔怎么来的。当然这个头衔是专家们投票得来,只是这个投票跟现在的选秀节目投票不一样,EM是凭借硬实力胜出的,有铁杆粉丝称之为“神的算法”。 EM算法之前,先要了解极大似然估计方法,这个在转发的博文《从最大似然到E...

2014-08-23 15:04:39

阅读数 5773

评论数 5

深度学习word2vec笔记之应用篇

深度学习word2vec笔记之应用篇 声明: 1)该博文是Google专家以及多位博主所无私奉献的论文资料整理的。具体引用的资料请看参考文献。具体的版本声明也参考原文献 2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是...

2014-08-16 13:57:04

阅读数 15105

评论数 14

深度学习word2vec笔记之算法篇

深度学习word2vec笔记之算法篇

2014-05-25 20:03:33

阅读数 43925

评论数 97

深度学习word2vec笔记之基础篇

深度学习word2vec笔记之基础篇

2014-05-25 16:00:16

阅读数 87499

评论数 125

ROC曲线与AUC计算

ROC曲线绘制与AUC计算           致谢 多位博主的无私分享。 参考文献 [1] http://blog.csdn.net/chjjunking/article/details/5933105 . chjjunking的博客 [2] http...

2014-04-21 20:42:37

阅读数 10398

评论数 1

互联网广告综述之点击率特征工程

互联网广告综述之点击率特征工程 声明: 1)该博文是整理自网上很大牛和专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献 2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大...

2014-02-11 21:44:14

阅读数 18865

评论数 4

广告点击率的贝叶斯平滑

广告点击率的贝叶斯平滑 一.点击率的贝叶斯平滑 预估互联网广告的点击率一个重要的技术手段是logistic regression模型,这个模型非常依赖特征的设计。每个广告的反馈ctr作为特征能极大地提升预估的准确性,所以每个广告的反馈ctr非常重要。 目前用得比较多的获取反馈ctr的方式是直...

2014-02-11 21:27:50

阅读数 31266

评论数 11

互联网广告综述之点击率系统

互联网广告综述之点击率系统 声明: 1)该博文是整理自网上很大牛和专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献 2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益...

2014-02-08 16:29:53

阅读数 16680

评论数 3

互联网广告系统综述一生态圈

互联网广告综述之生态圈 一.互联网广告行业生态 互联网广告是互联网行业最主要的赢利模式,流量变现成为互联网商业产品非常重要的评价标准。 随着互联网的发展,互联网的流量也是越来越大,2013上半年互联网广告投放总额达431亿元,可以预计,互联网广告的投放很快就会达到千亿元的标准。 如此一个巨大的市...

2014-02-08 16:08:23

阅读数 8587

评论数 2

从广义线性模型到逻辑回归

从广义线性模型到逻辑回归 一.广义线性回归 回归方式比较常用的有线性回归和logistic回归.基本的形式都是先设定h_θ (x),然后求最最大似然估计L(θ),然后求出l(θ)=logL(θ),然后用梯度上升法或其它方法求出θ,二种回归如此相似的原因就是在于它们都是广义线性模型里的一员。...

2014-02-08 15:30:21

阅读数 15647

评论数 1

在线学习算法FTRL

在线学习算法FTRL         优化算法中的LBFGS解法以及GD等解法,是对一批样本进行一次求解,得到一个全局最优解。     实际的互联网广告应用需要的是快速地进行model的更新。为了保证快速的更新,训练样本是一条一条地过来的,每来一个样本,model的参数对这个样本进行一次迭...

2014-02-08 11:01:58

阅读数 39399

评论数 5

OWL-QN算法

OWL-QN算法 转自: http://www.cnblogs.com/vivounicorn/archive/2012/06/25/2561071.html 一、BFGS算法       算法思想如下:            Step1   取初始点,初始正定矩阵,允许误差0&...

2014-02-07 20:50:11

阅读数 5801

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭