学习笔记
iteye_7356
这个作者很懒,什么都没留下…
展开
-
TagSoup开发指南
对于TagSoup可能有些人会比较陌生,TagSoup是Java语言开发的,通过SAX引擎解析结构糟糕、令人抓狂的不规范HTML文档的小工具。TagSoup可以将一个HTML文档转换为结构良好的XML文档(近似于XHTML),方便开发人员对获取的HTML文档进行解析等操作。同时TagSoup提供了命令行程序,可以运行TagSoup来对HTML文档进行解析。但是TagSoup的缺陷就是,官方...2011-06-05 20:12:40 · 1174 阅读 · 0 评论 -
HttpClient学习笔记(一)——介绍
HttpClient是Apache HttpComponents项目下的一个子项目,主要提供通过Java程序实现HTTP请求以及响应的处理,个人感觉还是个不错的小东西,用起来很简单方便。HttpClient的使用依赖于Apache commons项目中的两个组件——commons-logging.jar、commons-codec.jar。HttpClient中常用的类包括Http...2011-06-05 20:16:18 · 127 阅读 · 0 评论 -
HttpClient学习笔记(二)——通过程序访问人人网
先来分析下程序的流程,按照[url=/blog/1070623]前一章[/url]中所介绍的HttpClient所提供的功能支持,我们首先需要确定的是所要访问的目标服务器的域名(www.renren.com),确定访问方法(首次访问,一般都是GET请求),然后确定访问的路径(/,即根路径),端口为默认端口(80)。那么我们就可以通过以下一段代码向人人网服务器发送默认的“欢迎页面”发送请求了。 ...2011-06-05 20:29:49 · 148 阅读 · 0 评论