lucene学习日志(一)

由于实际需求,小小兵我最近对搜索引擎和网络爬虫产生了浓烈的兴趣,决定自己先写个网络爬虫试试,说不定以后在网上找资源就可以用得上了。小小兵真的是觉得手动在百度和google上找资源效率很低,再者,写个爬虫,这个逼可以吹一年,哈哈。

首先是环境的搭建,由于我是用java来做的,所以用eclipse来写,去http://archive.apache.org/dist/lucene/java/     去这个地址把架包下载好,然后导好包,环境就算搭建好啦。先写一个测试例子。以下贴出我的代码:

package test.lucene;


import java.io.IOException;
import java.io.StringReader;


import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;


public class TestLucene {
public static void main(String[] args) throws IOException {
Analyzer analyzer = new StandardAnalyzer();
TokenStream tokenStream = analyzer.tokenStream("", new StringReader("this is the first lucene test java project"));
Token token = new Token();
while(tokenStream.next(token) != null)
System.out.println(token.term());
}
}


运行结果如下:



由于lucene把this is 这种虚词裁剪掉了,留下来的都是一些关键词,所以才会剪切成这几个单词。

好了,今天先到这了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值