基本方法分为两大步,第一步即利用HttpClient建立网络连接并发送请求,第二步即利用HtmlParser解析网页。
1.利用HttpClient建立网络连接(并获得整个网页的内容)
首先,我们必须安装好 HttpClient。
HttpClient 可以在http://jakarta.apache.org/commons/httpclient/downloads.html下载
HttpClient 用到了 Apache Jakarta common 下的子项目 logging,可以从这个地址http://jakarta.apache.org/site/downloads/downloads_commons-logging.cgi下载到 common logging,从下载后的压缩包中取出 commons-logging.jar 加到 CLASSPATH 中