搜索引擎
文章平均质量分 78
cool_rain_man
这个作者很懒,什么都没留下…
展开
-
生活不可缺的43个搜索引擎
国内: 职位搜索 :www.hour41.com/search/p2005/房产搜索: www.foloda.com 购物搜索: www.askyaya.com 旅行搜索 :www.qunar.comwww.go10000.com生活搜索:www.kooxoo.com www.qikoo.com论坛搜索:www.qihoo.comwww.daqi.comBlog 搜索:blog.qihoo.com转载 2008-01-28 17:45:00 · 681 阅读 · 0 评论 -
Lucene-2.2.0 源代码阅读学习(1)
package org.apache.lucene.demo;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.index.IndexWriter;import java.io.File;import java.io.FileNotFoundException;impor转载 2008-04-01 14:40:00 · 949 阅读 · 0 评论 -
Lucene-2.2.0 源代码阅读学习(2)
IndexWriter是一个非常重要的工具。建立索引必须从它开始。而且,从它的构造函数开始。Document和Field是Lucene中两个最重要的概念。在建立索引的时候,也就是实例化一个索引器IndexWriter的之前,必须通过已经建立好的Document逻辑文件,将Document的对象添加到IndexWriter实例中,才能算是建立索引。Document汇集数据源,这个数据源是通过转载 2008-04-01 14:41:00 · 965 阅读 · 0 评论 -
Lucene-2.2.0 源代码阅读学习(3)
org.apache.lucene.demo.IndexFiles类中,使用递归的方式去索引文件。在构造了一个IndexWriter索引器之后,就可以向索引器中添加Doucument了,执行真正地建立索引的过程。遍历每个目录,因为每个目录中可能还存在目录,进行深度遍历,采用递归技术找到处于叶节点处的文件(普通的具有扩展名的文件,比如my.txt文件),然后调用如下代码中红色部分:static转载 2008-04-01 15:00:00 · 1058 阅读 · 0 评论 -
lucene的多种搜索2-SpanQuery
SpanQuery按照词在文章中的距离或者查询几个相邻词的查询 SpanQuery包括以下几种:SpanTermQuery:词距查询的基础,结果和TermQuery相似,只不过是增加了查询结果中单词的距离信息。SpanFirstQuery:在指定距离可以找到第一个单词的查询。SpanNearQuery:查询的几个语句之间保持者一定的距离。SpanOrQuery:同时查询转载 2008-04-03 16:05:00 · 1696 阅读 · 1 评论 -
lucene多种搜索方式详解例子
package src;import java.io.StringReader;import java.util.Date;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.SimpleAnalyzer;import org.apache.lucene.analysis.转载 2008-04-03 16:24:00 · 874 阅读 · 0 评论 -
lucene的多种搜索
lucene的搜索相当强大,它提供了很多辅助查询类,各自完成一种特殊的查询,也可以相互组合使用,来完成一些复杂的操作. public class Test{ Analyzer analyzer = new StandardAnalyzer(); RAMDirectory dire转载 2008-04-03 16:00:00 · 763 阅读 · 0 评论 -
Java实现利用搜索引擎收集网址的程序
这里讲的不是怎么使用搜索引擎,而是怎么让程序利用搜索引擎来搜集网址,这有什么用?很有用!网上动辄有人叫卖网址数据库,如发布软件网址、邮件地址、论坛网址、行业网址,这些网址是怎么来的呢?不可能是人手工收集而来的,都是让程序利用搜索引擎取到的,如果您需要某类网址信息数据,就跟我来一起研究一下,非常简单。 本文采用Java语言写成,以google和百度搜索引擎为对象。 我们要利用google转载 2008-01-21 11:44:00 · 1112 阅读 · 0 评论 -
lucene多字段查询
BooleanQuery typeNegativeSearch = new BooleanQuery();QueryParser parser = new QueryParser("contents", new Analyzer());parser.setDefaultOperator(QueryParser.AND_OPERATOR);query = parser.parse(queryStri转载 2008-04-30 10:13:00 · 2197 阅读 · 0 评论 -
lucene 搜索实践
基本流程1、 初始化IndexSearcher :Searcher searcher = new IndexSearcher(indexDir);//indexDir为索引存放路径2、 生成Query对象: QueryParser类的parse()方法返回Query类形对象3、 使用search(Query)方法,开始搜索,并返回Hits对象4、 使用Hits对象的方法检索结果:length();原创 2008-04-30 10:25:00 · 1141 阅读 · 0 评论 -
compass学习笔记
Compass概念:1:Compass相当于hb的SessionFactory2:CompassSession相当于hb的Session3:CompassTransaction相当于hb的transaction。Compass 也是采用CompassConfiguration(装载配置和映射文件)进行创建的。创建Compass时将会链接已经存在的索引或者创建一个新的索引。当Compass创建完后,转载 2007-12-29 09:12:00 · 1708 阅读 · 0 评论 -
最新中文行业垂直搜索引擎大全
排名不分先后,肯定还有很多新的搜索引擎未能搜集齐全,欢迎补充。此处主要针对新涌现的行业垂直搜索引擎,累计189家(不包括传统搜索及其分类搜索),这应该是目前最全面的整理结果。垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来转载 2008-01-31 14:00:00 · 3609 阅读 · 0 评论 -
影响中国发展的七大垂直搜索引擎!!
百度进军日本前途未卜,Google开进中国遭遇抄袭门,YAHOO中国再演变脸秀。2007年才刚刚过了三分之一,中国互联网搜索领域已是风声水起。殊不知,在这些互联网大鳄的身边,还潜伏着重重杀机,各类 的垂直搜索引擎正悄悄地圈地发展,乃至壮大,意图从百度、Google、YAHOO嘴里分一杯羹,我们可以看出这些有各类背景的垂直搜索引擎的发展,不但将影响搜索大鳄的市场,更将影响中国人的习惯和发展。1、论坛转载 2008-01-31 15:18:00 · 628 阅读 · 0 评论 -
除Google 以外的十七个搜索引擎创新
有许多新的搜索引擎(最新统计有100多个)都在开创一些搜索技术的创新。下面是一份17大搜索创新清单,我们认为,这些创新将来会是破坏性的(译者:关于破坏性创新,请参见这里)。这些创新分为4类:查询预处理 ;信息来源;算法改进;结果可视化和后处理。 [其中的某些创新也在Google的存在各种产品中,但是,正如下文所述,Google的主搜索页中不是缺失了这些功能,就是功能还很有限。查询预处理原创 2008-01-31 15:54:00 · 1037 阅读 · 0 评论 -
搜索引擎代码资源
1、Nutch官方网站 http://www.nutch.org/中文站点 http://www.nutchchina.com/最新版本:Nutch 0.7.2 ReleasedNutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网的搜索引擎,也可以针对整个网络建立搜索引擎。自由(Free)而免费(Free)。2、Lucen转载 2008-02-22 09:50:00 · 898 阅读 · 0 评论 -
源代码搜索引擎推荐
最近很流行代码搜索,对开发人员确实帮助不少,这里做个汇总,如果有其他比较好的,可以推荐下~推荐标准:快速、支持语言较全、Ajax支持1、gotAPI [ http://start.gotapi.com/ ]支持包括HTML, CSS, CSS2, Javascript, ActionScript,Google code, XML, XSL, XPath, XSD, PHP, Ruby, Pytho原创 2008-02-22 10:36:00 · 731 阅读 · 0 评论 -
lucene使用与优化
1 lucene简介1.1 什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2 lucene能做什么要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文搜索服务,告诉你你要转载 2008-03-10 10:16:00 · 694 阅读 · 0 评论 -
Google Suggest(完整实例)
环境:Tomcat 5.0,JDK1.4 myEclipse5.1,Hibernate3.1,Oracle 8i.创建表的脚本:--create table.create table COD_MAIN( ID NUMBER not null, CD_STYLE NUMBER(22), CD_CODE VARCHAR2(10), CD_CHINA VARCHAR2(60), C转载 2008-03-13 11:32:00 · 1164 阅读 · 0 评论 -
关于Google的Suggest功能的实现
大家都对Google的suggest的功能大概很有兴趣吧,我们觉得既然Google做的出,那么我们也能做出来,先对其进行分析,1.对于网页客户端的按键的动态变化,Ajax是最好的选择, 2.如果数据库的选择,则可以有多种选择得,BerkeleyDB, Derby甚至自己做个txt文本文件,把所需要的单词和result数目放在文本文件里都能够实现,但今天我们有了一个很好的索引工具Lucene。加转载 2008-03-13 15:28:00 · 1135 阅读 · 0 评论 -
利用Compass实现一个简单的搜索引擎
Compass是一流的开放源码JAVA搜索引擎框架,对于你的应用修饰,搜索引擎语义更具有能力。依靠顶级的Lucene搜索引擎,Compass 结合了,像 Hibernate和 Sprin的流行的框架,为你的应用提供了从数据模型和数据源同步改变的搜索力.并且添加了2方面的特征,事物管理和快速更新优化. Compass的目标是:把java应用简单集成到搜索引擎中.编码更少,查找数据更便捷转载 2007-12-29 09:15:00 · 1207 阅读 · 0 评论 -
利用Lucene搜索Java源代码
某些网站允许软件开发社团通过发布开发者指南、白皮书、FAQs【常见问题解答】和源代码以实现信息的共享。随着信息量的增长,和几个开发者贡献出自己的知识库,于是网站提供搜索引擎来搜索站点上现有的所有信息。虽然这些搜索引擎对文本文件的搜索可以做的很好,但对开发者搜索源代码做了比较严格的限制。搜索引擎认为源代码就是纯文本文件,因此,在这一点上,与成熟的可以处理大量源文件的工具――grep相比没有什么不转载 2008-05-27 13:36:00 · 886 阅读 · 0 评论