- 博客(10)
- 收藏
- 关注
转载 开始使用 Markdown
本文面向不了解 markdown 或刚准备上手的同学。它是什么首先,什么是 markdown?我们可以直接看一下 WIKI……不过 wiki很长,让人没有耐心读下去。那么,简单来说,markdown 其实是一种轻量级的标记语言;或者说,它规定了一些文本的书写格式,就像这样:写上你的标题============开始书写正文吧当然也可以用 *列表* 的形式:
2014-11-20 10:24:02
383
转载 搜索广告排序与定价
搜索引擎利用IR的方法对于一个特定的query检索出该关键词上的出价广告后,就需要对SERP页面上的广告栏分配给出价的广告主,牵扯到搜索广告的排序问题。一般共识是左侧的广告位(即搜索结果页上面的广告位)被看到和点击到的可能性最大,后侧的则按照从高到底排序,越靠上的广告位越好。简单的说就是谁出钱多谁得到的位置越好,复杂的研究这里面牵扯到博弈论之类的问题,假设存在n个对该关键词出价的广告主,k
2014-11-07 11:05:52
1940
转载 计算广告学(Computational Advertising)概述学习
简介计算广告学于2008年由Yahoo Research的A.Broder提出,详细的定义参看百度百科,广义的定义是通过科学计算来选择最优的广告投放,主要研究的是互联网上的广告投放,其中典型的是在搜索引擎上查询关键词结果页出现的“推广链接”。计算广告(或者说互联网广告)相比于传统的媒体广告的优势在于以下几点:投放的介质范围更广。传统的媒体广告一般只有相对较少的场合,例如报纸
2014-11-07 11:04:57
1123
转载 一致性哈希
一致性哈希的什么四个要素可以看这里。简单的说就是将缓存的数据和存储数据的机器使用相同的哈希函数映射到同一地址空间上上,每个机器负责整个地址空间中的一定范围内的数据。通常的模N的哈希算法会导致系统中机器数发生变化时需要进行大量的数据重分布,而一致性哈希的地址空间采用环状结构,每个节点i都一个哈希空间上的token(Ti),则该节点负责的数据一般为(Ti-1, Ti],即token落到
2014-11-07 11:04:42
316
转载 k-d tree的优化查找算法BBF
BBF(Best Bin First)是一种改进的k-d树最近邻查询算法。从前两篇标准的k-d树查询过程可以看出其搜索过程中的“回溯”是由“查询路径”来决定的,并没有考虑查询路径上数据点本身的一些性质。BBF的查询思路就是将“查询路径”上的节点进行排序,如按各自分割超平面(称为Bin)与查询点的距离排序。回溯检查总是从优先级最高的(Best Bin)的树节点开始。另外BBF还设置了一个运
2014-11-07 10:59:17
496
转载 k-d tree代码解析
上一篇较详细地介绍了k-d树算法。本文来讲解具体的实现代码。 首先是一些数据结构的定义。我们先来定义单个数据,代码如下://单个数据向量结构定义struct _Examplar{public: _Examplar():dom_dims(0){} //数据维度初始化为0 //带有完整的两个参数的constructor,这里con
2014-11-07 10:58:40
592
转载 各种字符串Hash函数比较
常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法。这些函数使用位运算使得每一个字符都对最后的函数值产生影响。另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎不可能找到碰撞。 常用字符串哈希函数有BKDRHash,APHash,DJBHash,JSHash,RSHash,SDBMHash,PJWHash,ELFHash等等。对于以上几种哈希函
2014-11-07 10:57:17
208
转载 机器学习中的相似性度量
( 转自:http://www.cnblogs.com/heaad/archive/2011/3/8.html ) 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结
2014-11-07 10:26:35
169
转载 k-d tree算法
k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。应用背景 SIFT算法中做特征点匹配的时候就会利用到k-d树。而特征点匹配实际上就是一个通过距离函数在高维矢量之间进行相似性检索的问题。针对如何快速而准确地找到查询点的近邻,现在提出了很多高维空间索引结构和近似查询的算法,k-d树就是其中
2014-11-07 10:20:45
238
转载 利用Simrank算法进行Query Rewriting
搜索引擎的检索结果页下方一般会提示多个相似的搜索关键词,这些词可以被看作查询关键词query的rewriting。在计算广告中,当某一个query没有对应的bid phase出价广告,或者该query对应的bid phase较少的时候,可以利用query rewriting获取相似query对应的广告进行显示,以期望获得更多的click。相似query的确定可以利用用户session中的搜
2014-11-04 15:48:43
558
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人