使用HttpClient开源工具包访问网络比HttpURLConnection省了不少事
步骤如下:
1.使用HttpPost提交表单数据,比如用户名密码什么的,HttpClient.getCookieStore().getCookies(),拿到到登陆Cookie
2.使用HttpGet获取要得到的页面,执行的时候带上得到的Cookie数据才能正确访问
我就抓取到了整个学校图书馆的用户信息啊哈哈哈(弱密码)
代码如下
package njupt;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.ArrayList;
import java.util.List;
import org.apache.http.Consts;
import org.apache.http.HttpResponse;
import org.apache.http.NameValuePair;
import org.apache.http.client.HttpClient;
import org.apache.http.client.entity.UrlEncodedFormEntity;
import org.apache.http.client.methods.HttpGet;
import org