使用爬虫的工具的是利用myeclipse和Apache来实现,其中,Apache是有多个版本的,多个版本之间有很多函数和类是不同的,需要根据具体使用的版本号来选取对应的函数。这里使用的是Apache4.3。具体实现代码如下:
package test123;
/
//Date:2016.2.19
//Writer:P.C.
//Description: 使用Get方法获取网页源码
import java.io.IOError;
import java.io.IOException;
import org.apache.http.HttpEntity;
import org.apache.http.HttpRequest;
import org.apache.http.HttpResponse;
import org.apache.http.client.ClientProtocolException;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
//import org.apache.http.impl.client.DefaultHttpClient;//本类包内的内容可以使用,所以画横线,但已不推荐使用
import org.apache.http.util.EntityUtils;
//public class initial {
// public static void main(String[] argx){
// String path="http://www.***.com";