- 博客(3)
- 资源 (4)
- 收藏
- 关注
原创 htmlparser的一个入门使用实例,公做感觉。
<br />package org.htmlparser;<br />import java.net.URL;<br />import org.htmlparser.beans.LinkBean;<br />import org.htmlparser.visitors.NodeVisitor;<br />public class ParserTest {<br /> public static void main(String[] args) {<br /> // ParserTest.printAllT
2011-01-20 00:23:00 437
原创 htmlparser的关键类
<br />AndFilter 相当于一个AND操作符,接受所有同时满足两个Filter的节点.<br />CssSelectorNodeFilter 接受所有支持CSS2选择器的节点.<br />HasAttributeFilter 接受所有否含有某个属性(还可以设置该属性的值)的节点.<br />HasChildFilter 接受所有含有子节点符合该Filter的节点.<br />HasParentFilter 接受所有含有父节点符合该Filter的节点.<br />HasSiblingFilter 接
2011-01-20 00:20:00 266
转载 Lucene
<br />Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章的关键词,通常我们需要如下处理措施 a.我们现在有的是文章内容,即一个字符串,我们先要找出字符串中的所有单词,即分词
2011-01-13 00:12:00 226
大型网站应对高负载和并发的解决方案
2010-06-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人