- 博客(8)
- 问答 (2)
- 收藏
- 关注
dom4j处理超大XML
英文原文 : http://dom4j.sourceforge.net/dom4j-1.6.1/faq.html#large-doc dom4j提供了基于事件的模型来操作xml文档。利用该模型开发人员可以一部分、一部分的处理XML文档,而不需要将整个XML文档都加载到内存中。例如:假想你要处理一个非常大的XML文档,它可能是由数据库的某张数据表而来的。如下所示: ... ...
2010-12-26 23:35:21 346
jquery dual list 插件
In my work, I came across the need for a web control that would allow me to have two <select> elements, and be able to easily transfer <option> elements between them. The idea is to ha...
2010-12-21 17:24:12 199
jQuery Textarea 字符统计插件
This plugin allows you to set and limit user input by max characters within html textarea (it is only limited by characters other than words). It binds keyup, paste and drag events. The extra div is d...
2010-12-21 09:24:01 96
原创 Start PageIndexHistoryLast Change
The specifications should provide the developer with the information needed to implement the protocol. NOTE: The JSON-RPC 2.0 Specification proposal has been published and open for review and comm...
2010-12-15 00:22:51 75
NOKIA手机电话簿向HTC G7的成功转移
我这里用的是NOKIA 5230, 首先要下载NOKIA Pc套件和GO Contact Sync 软件 1,使用NOKIA是pc套件,“同步”--选择Microsoft outlook--(注意,这里要提前把outlook打开)--后面直接下一步下一步就好了,最后同步完成 在outlook的联系人里会出现你的所有电话联系人 2,下载GO Contact Sync 软件,自己百...
2010-12-12 23:12:54 103
heritrix3源码分析(outbound 和inbound)
heritrix3 与heritrix1.14 相比有很大不同, heritrix3 定义了一种阻塞的FIFO queue, 属于典型的生产消费者模型 AbstractFrontier 中定义了2个 容器, inbound 和outbound inbound 容器存储的是那些即将要处理的crawlUrI, heritrix 爬取到的链接, 准备处理的链接都是先放在inbound ...
2010-12-03 21:40:27 163
heritrix3 伪装成GOOGLE进行爬取
伪装成搜索引擎蜘蛛google bot访问需网站, 这样能防止爬虫被封 在crawler-beans.cxml 中修改metadata成下面 <!-- CRAWL METADATA: including identification of crawler/operator --> <bean id="metadata" class="org.archive.module...
2010-12-03 21:34:34 158
原创 超棒的 HTML 解析器 jsoup 1.4.1 发布
该版本包含一些新的功能,例如从输入流中解析HTML、DOM克隆、:not() 伪CSS的选择器;同时也修复了一些bug,提升了稳定性;改进了HTTP的连接处理和更强的文档规范化。 jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。 jsoup的主要功能...
2010-12-01 12:17:05 97
空空如也
webwork中的这一个类有什么作用?
2009-09-29
EJB部署
2008-08-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人