自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

转载 深入 Lucene 索引机制

Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。 在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构...

2008-08-25 16:40:00 78

转载 Compass--在Lucene之上作了什么增强?

原贴地址: 已加入Opensymphony的Compass 是对Lucene搜索引擎在企业应用(数据库应用)中的增强。 Lucene本身的API已经非常简单,看看IBM DW上的Beef up Web search apps with Lucene已经大概了解,那Compass还能做什么样的增强呢? 1.在我的项目里,最实际的增强就是Data Mirror功能。 ...

2008-08-25 12:33:00 94

转载 lucene学习笔记

1. 有时对于一个Document来说,有一些Field会被频繁地操作,而另一些Field则不会。这时可以将频繁操作的Field和其他Field分开存放,而在搜索时同时检索这两部分Field而提取出一个完整的Document。 这要求两个索引包含的Document的数量必须相同。 在创建索引的时候,可以同时创建多个IndexWriter,将一个Document根据需要拆分成多个包含...

2008-07-07 14:02:00 147

转载 搜索引擎中网络爬虫的设计分析

下面简单介绍一下搜索引擎的机器爬虫的制作和一些基本要注意的事项。 说的简单易懂一些,网络爬虫跟你使用的〖离线阅读〗工具差不多。说离线,其实还是要跟网络联结,否则怎么抓东西下来?那么不同的地方在哪里? 1】 网络爬虫高度可配置性。 2】 网络爬虫可以解析抓到的网页里的链接 3】 网络爬虫有简单的存储配置 4】 网络爬虫拥有智能的根据网页更新分析功能 5】 网络爬虫的...

2008-04-24 15:07:00 203

转载 在Java程序中处理数据库超时与死锁

每个使用关系型数据库的程序都可能遇到数据死锁或不可用的情况,而这些情况需要在代码中编程来解决;本文主要介绍与数据库事务死锁等情况相关的重试逻辑概念,此外,还会探讨如何避免死锁等问题,文章以DB2(版本9)与Java为例进行讲解。 什么是数据库锁定与死锁 锁定(Locking)发生在当一个事务获得对某一资源的“锁”时,这时,其他的事务就不能更改这个资源了,这...

2008-04-02 16:41:00 174

转载 用 Lucene 加速 Web 搜索应用程序的开发

Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。在这篇文章中,我们首先来看如何利用 Lucene 实现高级搜索功能,然后学习如何利用 Lucene 来创建一个健壮的 Web 搜索应用程序。 在本篇文章中,你会学习到如何利用 Lucene 实现高级搜索功能以及如何利用 Lucene 来创建 Web 搜索应用程序。通过这些学...

2008-03-28 10:06:00 72

转载 Lucene的特性分析

3.1. Lucene核心部分——索引排序 Lucene 的索引排序是使用了倒排序原理。 该结构及相应的生成算法如下: 设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1. 由于lucene是基于关键词索引和查询...

2008-03-28 09:37:00 81

转载 lucene使用与优化

1lucene简介 1.1什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者googleDesktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2lucene能做什么 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提...

2008-01-24 13:09:00 69

转载 luncene 查询字符串的解析-QueryParser类

搜索流程中的第二步就是构建一个Query。下面就来介绍Query及其构建。 当用户输入一个关键字,搜索引擎接收到后,并不是立刻就将它放入后台开始进行关键字的检索,而应当首先对这个关键字进行一定的分析和处理,使之成为一种后台可以理解的形式,只有这样,才能提高检索的效率,同时检索出更加有效的结果。那么,在Lucene中,这种处理,其实就是构建一个Query对象。 就Query对象本身言,...

2008-01-24 11:59:00 120

转载 AJAX学习心得

在我的文件下有AJAX开发简略.rar跟ajaxdemo.rar,大家有兴趣的话可以下载AJAX开发简略.rar:是电子书.ajaxdemo.rar:是我写的一个Demo.(过几天我会写个AJAX+lucene写个搜索引擎的例子传上来,大家一起研究) 转载于:https://www.cnblogs.com/bysshijiajia/archive/2006/09/08/ajax.h...

2006-09-08 13:37:00 56

转载 利用lucene搜索

某些网站允许软件开发社团通过发布开发者指南、白皮书、FAQs【常见问题解答】和源代码以实现信息的共享。随着信息量的增长,和几个开发者贡献出自己的知识库,于是网站提供搜索引擎来搜索站点上现有的所有信息。虽然这些搜索引擎对文本文件的搜索可以做的很好,但对开发者搜索源代码做了比较严格的限制。搜索引擎认为源代码就是纯文本文件,因此,在这一点上,与成熟的可以处理大量源文件的工具――grep相比没有...

2006-09-08 11:55:00 91

转载 Java如何使用lucene开发搜索引擎

最近忽然心血来潮想用java写个搜索引擎,经过一天的研究也有小成,把自己写的一个简单的Hello word发给大家看看,希望对大家有所帮助.关于lucene的架包可以在apache的官方网站下载到,如果需要问我要.如果对lucene不了解的可以先看一下我的利用lucene搜索这篇文章,或则到网上去查一下资料./** author:shijiajia* Created on 2006-...

2006-09-08 11:47:00 174

转载 浅谈velocity struts

关于MVC的解决方案,现在可以说是多种多样,各种framework层出不穷,在这些解决方案中,最经典,用户群最多的就是struts了,在这里我说它是最经典的,并不是说它是技术最先进的。然而,在真正的项目开发中,考虑到系统以后的维护和技术人员的技术水平,我想还是会有一大批的项目经理选择它。 Velocity严格上来说并不是一个MVC的解决方案,它更多是在关注表现层的东西,它的核心是“模板语...

2006-09-08 11:30:00 106

转载 Ibatis开发Demo

第一步:package com.ibatis; public class Author {private int id;private String name;public int getId() {return id;}public void setId(int id) {this.id = id;}public String getName() {retu...

2006-09-08 11:06:00 114

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除