自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 问答 (2)
  • 收藏
  • 关注

dom4j处理超大XML

英文原文 : http://dom4j.sourceforge.net/dom4j-1.6.1/faq.html#large-doc dom4j提供了基于事件的模型来操作xml文档。利用该模型开发人员可以一部分、一部分的处理XML文档,而不需要将整个XML文档都加载到内存中。例如:假想你要处理一个非常大的XML文档,它可能是由数据库的某张数据表而来的。如下所示: ... ...

2010-12-26 23:35:21 346

jquery dual list 插件

In my work, I came across the need for a web control that would allow me to have two <select> elements, and be able to easily transfer <option> elements between them. The idea is to ha...

2010-12-21 17:24:12 199

jQuery Textarea 字符统计插件

This plugin allows you to set and limit user input by max characters within html textarea (it is only limited by characters other than words). It binds keyup, paste and drag events. The extra div is d...

2010-12-21 09:24:01 96

原创 Start PageIndexHistoryLast Change

The specifications should provide the developer with the information needed to implement the protocol. NOTE: The JSON-RPC 2.0 Specification proposal has been published and open for review and comm...

2010-12-15 00:22:51 75

NOKIA手机电话簿向HTC G7的成功转移

我这里用的是NOKIA 5230, 首先要下载NOKIA Pc套件和GO Contact Sync 软件 1,使用NOKIA是pc套件,“同步”--选择Microsoft outlook--(注意,这里要提前把outlook打开)--后面直接下一步下一步就好了,最后同步完成 在outlook的联系人里会出现你的所有电话联系人 2,下载GO Contact Sync 软件,自己百...

2010-12-12 23:12:54 103

heritrix3源码分析(outbound 和inbound)

heritrix3 与heritrix1.14 相比有很大不同, heritrix3 定义了一种阻塞的FIFO queue, 属于典型的生产消费者模型 AbstractFrontier 中定义了2个 容器, inbound 和outbound inbound 容器存储的是那些即将要处理的crawlUrI, heritrix 爬取到的链接, 准备处理的链接都是先放在inbound ...

2010-12-03 21:40:27 163

heritrix3 伪装成GOOGLE进行爬取

伪装成搜索引擎蜘蛛google bot访问需网站, 这样能防止爬虫被封 在crawler-beans.cxml 中修改metadata成下面 <!-- CRAWL METADATA: including identification of crawler/operator --> <bean id="metadata" class="org.archive.module...

2010-12-03 21:34:34 158

原创 超棒的 HTML 解析器 jsoup 1.4.1 发布

该版本包含一些新的功能,例如从输入流中解析HTML、DOM克隆、:not() 伪CSS的选择器;同时也修复了一些bug,提升了稳定性;改进了HTTP的连接处理和更强的文档规范化。 jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。 jsoup的主要功能...

2010-12-01 12:17:05 97

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除