![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Search Engine
文章平均质量分 82
idouba
这个作者很懒,什么都没留下…
展开
-
Google 数学之美系列整理
摘自自 Google黑板报。07年的时候读完了google黑板报的这个系列的文章,正好教研室里做的事情是搜索引擎相关的,分词、关键字权重计算、索引等等,都是当时组里会用到的。也符合自己的工程要做的学术点的思路,在做项目中能挖掘学习些东西,这样才会更充实。 现在已经用得比较少了,但是还是愿意整理下,复习下。可以体会到新的东西。转载 2010-12-12 15:13:00 · 11652 阅读 · 0 评论 -
Google 的秘密- PageRank 彻底解说 中文版
索引前言PageRank 的基本概念怎样求得 PageRank实际应用时的问题Namazu 上的实际安装实验对 PageRank 的个人见解参考文献附录:「guguru?/gouguru?」Since: Thu Feb 1 18:22:44 JST 2001L转载 2011-10-07 21:23:06 · 1773 阅读 · 0 评论 -
Google BigTable 翻译 ---大表(Bigtable):结构化数据的分布存储系统
Google BigTable 翻译 ---大表(Bigtable):结构化数据的分布存储系统 摘要 bigtable是设计来分布存储大规模结构化数据的,从设计上它可以扩展到上2^50字节,分布存储在几千个普通服务器上.Google的很多 项目使用BT来存储数据,包括转载 2011-08-23 17:55:36 · 1277 阅读 · 0 评论 -
Lucene:基于Java的全文检索引擎简介
Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking转载 2011-07-21 14:12:17 · 351 阅读 · 0 评论 -
Google Architecture
<br />如何使用客户端写博客?<br />http://highscalability.com/google-architecture<br /> <br />Update 2:Sorting 1 PB with MapReduce. PB is not peanut-butter-and-jelly misspelled. It's 1 petabyte or 1000 terabytes or 1,000,000 gigabytes. It took six hours and two minu转载 2011-02-13 16:45:00 · 890 阅读 · 0 评论