![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
文章平均质量分 88
彭冬
从事软件开发,系统设计近10年,曾是新浪微博广告商业化系统创建的核心人员,在新浪微博期间参与了多个商业化产品的设计和实现,包括品牌广告投放系统,粉丝通微博竞价广告系统等。后加入百度,负责百度大数据平台搭建和用户特征挖掘工作。2015年初与朋友合伙创建趣点在线科技(北京)有限公司,全面负责公司技术。
展开
-
搜索引擎中的查询模型
搜索引擎中的查询模型posted by Andrew (justAStriver@gmail.com)2013-03-03搜索排序也是搜索引擎的核心部分,技术已经比较成熟,其中的查询检索模型主要有以下几个:1.布尔模型布尔模型是最简单的查询模型,文档包含查询词标记为1,否则为0,最后通过使用与或关系进行匹配。如用户查询词A && B && (C || D),假设只有4个文档,包原创 2013-03-03 13:26:21 · 1698 阅读 · 0 评论 -
压缩算法之Elias Gamma Coding & Elias Delta Coding
压缩算法之Elias Gamma Coding & Elias Delta CodingPosted by Andrew(justAStriver@gmail.com)2013-02-24基本概念压缩算法一般根据应用场景不同可分为文本压缩和索引压缩,后者是搜索引擎的核心技术之一。压缩的本质是对数据进行重新编码,编码依据是数据的分布特性,一般是概率分布情况,比如对于倒排索引中的数字编原创 2013-02-24 18:51:30 · 4623 阅读 · 1 评论 -
Google技术知多少
Google技术知多少posted by Andrew(justastriver@gmail.com)google技术都具有标杆作用,也是体现了目前互联网各个技术的最高水平,其论文更是开源界的参考依据。下面从文件系统,分布式存储及高性能计算方面总结一下google的各大技术。文件系统GFS即Google File System,是google的分布式文件系统。GFS采用主从原创 2013-03-09 18:15:15 · 1224 阅读 · 0 评论