品味Google带给我们的算法理论

本文探讨了Google从最初的PageRank到Caffeine,再到Hummingbird的搜索算法演变。Hummingbird算法提升了处理复杂查询的能力,更加注重语义理解和页面质量。同时,文章还对比了PageRank和HITS算法,分析了它们的优缺点及应用场景。
摘要由CSDN通过智能技术生成

最近在公司分享了Google的大数据背景下的一系列论文所诞生的强大技术好设计思路

GPS/MapReduce和BigTable作为第一代的技术背景

随着社交网络的发展,2010年,Google发布代号为Caffeine的新一代搜索引擎技术,来支持增量索引更新(帮组Google更好的收集信息(索引)而不是给信息排序。Google Caffeine给网络开发与SEO带来相当大的冲击),以及Pregel这种图形数据库模型的计算思路

而最近发布的蜂鸟(Hummingbird)再一次更新了技术到另外一个层次高度。

最新的一代,相比之前有哪些差异,有哪些突出优点呢:

 

1:解决的问题

随着搜索查询变得更加复杂,传统的Boolean算法(一种基于关键字的搜索算法)开始恶化,因为现在搜索结果不仅要与字词匹配,还要与概念和意义相匹配

默认:搜索时还要考虑上下文,搜索人的时间、年龄、性别、地域、性格、爱好,显然复杂多了。

 

2:搜索算法的意义

给每一次搜索请求从数十亿网页和信息进行排序,以获取最佳答案。简单来说,搜索引擎算法就是搜索网络中的资源,然后在服务器中建立索引,供快速查询的算法

起始:就是针对海量的数据提供一种快速的获取相应的预期数据的一种处理思路

 

3:是否传统的PageRank算法已经OutDate了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值