最近在公司分享了Google的大数据背景下的一系列论文所诞生的强大技术好设计思路
GPS/MapReduce和BigTable作为第一代的技术背景
随着社交网络的发展,2010年,Google发布代号为Caffeine的新一代搜索引擎技术,来支持增量索引更新(帮组Google更好的收集信息(索引)而不是给信息排序。Google Caffeine给网络开发与SEO带来相当大的冲击),以及Pregel这种图形数据库模型的计算思路
而最近发布的蜂鸟(Hummingbird)再一次更新了技术到另外一个层次高度。
最新的一代,相比之前有哪些差异,有哪些突出优点呢:
1:解决的问题
随着搜索查询变得更加复杂,传统的Boolean算法(一种基于关键字的搜索算法)开始恶化,因为现在搜索结果不仅要与字词匹配,还要与概念和意义相匹配
默认:搜索时还要考虑上下文,搜索人的时间、年龄、性别、地域、性格、爱好,显然复杂多了。
2:搜索算法的意义
给每一次搜索请求从数十亿网页和信息进行排序,以获取最佳答案。简单来说,搜索引擎算法就是搜索网络中的资源,然后在服务器中建立索引,供快速查询的算法
起始:就是针对海量的数据提供一种快速的获取相应的预期数据的一种处理思路
3:是否传统的PageRank算法已经OutDate了