使用HTTPURLConnection模拟登陆,爬取网页内容

本文介绍如何利用Java的HTTPURLConnection类模拟登陆,通过Fiddler抓取登录参数,设置Cookie来实现对需要登录才能访问的网页内容的爬取。重点在于理解和设置请求属性,以及处理中文编码问题。
摘要由CSDN通过智能技术生成

如果你需要爬取某些网页的内容,但这些网站需要登录,那就需要一些额外的步骤来由程序来完成这些登录并爬取我们需要的网页内容了,任意登录页面都是向服务器发送请求,如果我们能够模拟向服务器发送请求,那么自然登录也就不在话下,通过Fiddler抓取我们需要的一些信息,很轻松的就能模拟出向服务器发送的请求,下面我们可以使用HTTPURLConnection进行模拟登陆并爬取我们需要的网页内容。


import java.io.BufferedReader;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map.Entry;

public class INotesPost {

	public static void main(String[] args) throws Exception {
		String surl = "***?login";
		URL url = new URL(surl);
		HttpURLConnection connection = (HttpURLConnection) url.openConnection();

		connection.setDoOutput(true);
		connection.setDoInput(true);
		connection.setRequestMethod("POST");
		connection.setUseCaches(false);
		connection.setRequestProperty("Content-Type", "application/x-www-form-urlenco
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值