- 博客(2)
- 资源 (6)
- 收藏
- 关注
原创 写了第一个lucene程序(lucene学习笔记)
基本参考了《lucene in action》里面的写法,只是根据Lucene的版本做了小部分变化。网页爬虫爬的数据终于有了用武之地:)Indexer类,主要是建立索引package com.hudson.lucenestudy;import org.apache.lucene.document.Field;import org.apache.lucene.document.Document;import org.apache.lucene.analysis.standard.StandardA
2010-12-30 15:48:00
436
原创 用java写了一个非常简单的网页爬虫
可以设置最大爬取的网页数,并且自动添加网页链接package com.hudson.test;import java.io.BufferedReader;import java.io.File;import java.io.FileWriter;import java.io.IOException;import java.io.InputStreamReader;import java.net.HttpURLConnection;import java.net.URL;imp
2010-12-27 19:54:00
1066
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人