自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 java发email

○一个简单的文本邮件我们的第一个例子是利用你本地的邮件服务器向"John Doe"发送一个基本邮件信息。import org.apache.commons.mail.SimpleEmail;...  SimpleEmail email = new SimpleEmail();  email.setHostName("mail.myserver.com");  email.a...

2009-09-11 18:13:02 211

原创 使用Ant实现zip压缩解压功能

[关键词]:ant,zip,unzip,Apache,压缩,解压,中文乱码,ZipEntry     先前写了一篇blog《使用org.apache.tools.zip实现zip压缩和解压》 ,现对它进行了改进:找出了几个Bug,修改了部分代码,增加了注释,添加了图形界面,打了个可执行包,双就可以运行了。源代码如下,希望大家多提意见。MyZip.java:package myzip;imp...

2009-08-25 23:02:55 828

原创 Nutch搜索引擎分析

一、系统架构  总体上Nutch可以分为2个部分:抓取部分和搜索部分。抓取程序抓取页面并把抓取回来的数据做成反向索引,搜索程序则对反向索引搜索回答用户的请求。抓取程序和搜索程序的接口是索引,两者都使用索引中的字段。抓取程序和搜索程序可以分别位于不同的机器上。下面详细介绍一下抓取部分。抓取部分:  抓取程序是被Nutch的抓取工具驱动的。这是一组工具,用来建立和维护几个不同的数据结构: web da...

2009-08-25 22:58:02 118

原创 开源搜索引擎聚合

开源搜索引擎聚合开源搜索引擎工具包1.Lucene (http://lucene.apache.org/)Lucene是目前最为流行的开放源代码全文搜索引擎工具包,隶属于Apache基金会,由资深全文索引/检索专家Doug Cutting所发起,并以其妻子的中间名作为项目的名称。Lucene不是一个具有完整特征的搜索应用程序,而是一个专注于文本索引和搜索的工具包,能够为应用程序添加索引与搜索能力。...

2009-08-25 22:57:00 360

原创 【转】站内搜索引擎Nutch【配置】全过程(ubuntu)

下载:可以去Apache的官方网页http://www.apache.org/dyn/closer.cgi/lucene/nutch/ 下载最新版的Nutch,目前最新版是nutch-0.9,65M大小。解压缩,进入bin/就能用。安装辅助软件(运行环境):①JDK,Nutch是用java写的一个开源项目,所以要使它正常运行必须安装JDK(也为了能修改nutch),Java 1.4.x以上版本,设...

2009-08-25 22:55:27 130

原创 用JAVA读取rar文件中文件的名称和打开文件读出文件的内容

 package com;import java.util.*;import java.lang.Runtime.*;import java.io.*;public class UnRarTest {public static void main(String[] args) throws Exception{ Scanner in=new Scanne...

2009-08-25 22:49:51 696

原创 Lucene结果分页

Lucene结果分页Lucene结果分页一 ,Hits对象是搜索结果的集合 主要有下面几个方法  在session中保留indexreader对象和hit对象,翻页的时候提取内容 不使用session,每次都简单处理为重新查询 lucene推荐先使用第二个办法,即每次都重新查询,这样做的好处是简单方便,不需要考虑session的问题,lucene的查询效率也能保证每次查询时间不长,除非...

2009-08-25 22:36:16 154

原创 Lucene推荐资源总结

1)Apache的首页    http://lucene.apache.org/java/docs/index.html    里面包含的file format应该是开始了解lucene的必读内容,Query Syntax描述输入关键词得语法。当然,结合程序代码一起看会效果更好。2)lucene 倒排索引的原理    http://www.zhanglihai.com/blog/c_296.htm...

2009-08-25 22:34:34 122

原创 并行索引.多目录

1、多字段搜索就是同时要一个以上的字段中的内容进行比较搜索,类似概念在SQL中就是select * from Table where a like '%query%' or b like '%query%'。  Lucene.net中的单个字段查询大家都比较熟悉,这里对字段content进行搜索Query query = QueryParser.Parse(querystr,"content"...

2009-08-25 22:33:46 137

原创 给Lucene加入性能更好的中文分词

Lucene本身的StandardAnalyzer提供了中文分词接口,不过其采用的为1-gram. 这种分词方法虽然不会损失任何索引信息,但是造成的索引垃圾太多,用户得到的查询结果中垃圾也是很多.   Lucene本身的StandardAnalyzer提供了中文分词接口,不过其采用的为1-gram.  这种分词方法虽然不会损失任何索引信息,但是造成的索引垃圾太多,用户得到的查询结果中垃圾也是很多....

2009-08-25 22:30:15 77

原创 关于lucene2.0的创建、检索和删除功能的完整实现

文章来源:http://blog.csdn.net/xiaodaoxiao ... /09/10/1203959.aspx   最近要做一个站内的全文检索功能,主要是针对clob字段的,于是去网上找了点lucene的资料,现在新版本的是2.0.0,网上的例子多是1.4.3的,有些方法已经废弃了,搞了n久终于把2.0.0的功能实现了,呵呵,下面把实现的代码贴出来,实现了索引的创建、检索和删除功能,并...

2009-08-25 22:26:31 86

原创 用lucene为数据库搜索建立增量索引

用 lucene 建立索引不可能每次都重新开始建立,而是按照新增加的记录,一次次的递增建立索引的IndexWriter类,有三个参数 IndexWriter writer = new IndexWriter(path, new StandardAnalyzer(),isEmpty);其中第三个参数是bool型的,指定它可以确定是增量索引,还是重建索引.对于从数据库中读取的记录,譬如要为文章建立索引...

2009-08-25 22:24:02 74

原创 Lucene源代码之高亮显示

慢慢开始读Lucene源代码,首先就从高亮显示开始吧,因为最近才看过这个,而且好像是新版本后来加上的。我的方案:从实例逐一解决源代码。需要分析的实例代码:package org.apache.lucene.search.highlight; import java.io.IOException; import java.io.StringReader; import jun...

2009-08-25 22:20:04 98

原创 实战 Lucene,第 1 部分: 初识 Lucene

本文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。<!--START RESERVED FOR FUTURE USE INCLUDE FILES--><!-- include java script once we verify teams wants to use this and it will wo...

2009-08-25 22:13:44 63

基于用户令牌实现Web服务身份验证

!"# 服务技术被称为下一代!"# 的主流技术,但!"# 服务的安全性问题一直是人们讨论的重点,如何对 !"# 服务调用者进行身份验证是其中的一个主要问题。本文将主要介绍在!+, 环境下使用用户令牌实现!"# 服务访问 控制的基本原理和实现过程。

2009-04-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除