![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索技术
玉羽凌风
这个作者很懒,什么都没留下…
展开
-
框计算精确搜索之架构篇
一年多来,百度开放平台已经和400多家合作伙伴实现了合作,覆盖了人们出行、娱乐、商务、工作等方方面面。面对每天超过一亿次的海量搜索请求,如何精确地理解用户需求,将最优质恰当的资源用最优的样式展现给用户,这都需要一个优秀的检索架构来支撑。对于一次检索请求,搜转载 2011-09-24 11:46:50 · 616 阅读 · 0 评论 -
日志分析方法概述
日志在计算机系统中是一个非常广泛的概念,任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志的内容、规模和用途也各不相同,很难一概而论。本文讨论的日志处理方法中的日志,仅指Web日志。其实并没有精确的定义,可能包括但不限于各种前端Web服务器——apache、转载 2011-09-24 11:52:11 · 543 阅读 · 0 评论 -
百度框计算数据引入方式
目前,开放成为互联网一大主题,只有开放资源才能求得各方共赢。百度公司在2010年百度世界大会上正式推出了代表开放的两大平台,分别是搜索数据开放平台和应用开放平台,百度公司所倡导的框计算就此体现出了真正的实际应用价值。作为其中数据开放平台,开放了多个类目的数据引入渠道,为众多优质网转载 2011-09-24 11:48:59 · 728 阅读 · 0 评论 -
Hadoop全局排序
1. Hellow hadoop~~!Hadoop(某人儿子的一只虚拟大象的名字)是一个复杂到极致,又简单到极致的东西。说它复杂,是因为一个hadoop集群往往有几十台甚至成百上千台low cost的计算机组成,你运行的每一个任务都要在这些计算机上做任务的分发转载 2011-09-24 11:53:53 · 2053 阅读 · 0 评论 -
以求医为例谈搜索引擎排序
我们向搜索引擎提交一个查询,搜索引擎会从先到后列出大量的结果,这些结果排序的标准是什么呢?这个看似简单的问题,却是信息检索专家们研究的核心难题之一。 为了说明这个问题,我们来研究一个比搜索引擎更加古老的话题:求医。比如,如果我牙疼,应该去看怎样的医生呢?假设我只有三种选转载 2011-09-24 12:31:37 · 789 阅读 · 0 评论 -
将HTML里标签里的img src属性的相对地址替换成对应的绝对地址
主要利用了Jsoup,/** * 将文本中的相对地址转换成对应的绝对地址 * @param content * @param baseUrl * @return */ private static String processImgSrc(String content,String baseUrl){ Document原创 2015-08-29 00:23:43 · 7143 阅读 · 0 评论