1)webclient 读取网页 2)将读取的内容分词(盘古分词) 3)得到分词后的网页索引进Lucene 4)通过索引读取存入的网页数据 转载于:https://www.cnblogs.com/master-zhu/archive/2010/06/29/1767711.html