Java 爬虫实战之模拟登陆

使用Jsoup模拟登陆CSDN

0.总结

Get to the key point firstly, the article comes from LawsonAbs!

大体思路如下:

  • step1. 第一次请求登陆页面,获取页面信息,包含表单信息,和cookie(这个很重要),拿不到,会模拟登陆不上
  • step2. 第二次登陆,设置用户名,密码,把第一次的cookie,放进去,即可
  • step3.怎么确定是否登陆成功?
    登陆后,打印页面,会看到账户的详细信息。

1.代码
import java.io.IOException;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.Connection.Method;
import org.jsoup.Connection.Response;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class LoginDemo {
    public static void main(String[] args) throws Exception {
        LoginDemo loginDemo = new LoginDemo();
        loginDemo.login("16xxx20xxx", "16xxx20xxx");// 用户名,和密码
    }
    /**
     * 模拟登陆座位系统
     * @param userName
     *            用户名
     * @param pwd
     *            密码
     *
     * **/
    public void login(String userName, String pwd) throws Exception {
        // 第一次请求
        Connection con = Jsoup
                .connect("http://lib???.?????????.aspx");// 获取连接
        con.header("User-Agent",
                "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0");// 配置模拟浏览器
        Response rs = con.execute();// 获取响应
        Document d1 = Jsoup.parse(rs.body());// 转换为Dom树
        List<Element> et = d1.select("#form1");// 获取form表单,可以通过查看页面源码代码得知
        // 获取,cooking和表单属性,下面map存放post时的数据
        Map<String, String> datas = new HashMap<>();
        for (Element e : et.get(0).getAllElements()) {
            //System.out.println(e.attr("name")+"----Little\n");
            if (e.attr("name").equals("tbUserName")) {
                e.attr("value", userName);// 设置用户名
            }

            if (e.attr("name").equals("tbPassWord")) {
                e.attr("value", pwd); // 设置用户密码
            }
            if (e.attr("name").length() > 0) {// 排除空值表单属性
                datas.put(e.attr("name"), e.attr("value"));
            }
        }


        /**
         * 第二次请求,post表单数据,以及cookie信息
         *
         * **/
        Connection con2 = Jsoup
                .connect("http://lib???.?????????.aspx");
        con2.header("User-Agent",
                "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0");
        // 设置cookie和post上面的map数据
        Response login = con2.ignoreContentType(true).method(Method.POST)
                .data(datas).cookies(rs.cookies()).execute();

        // 登陆成功后的cookie信息,可以保存到本地,以后登陆时,只需一次登陆即可
        Map<String, String> map = login.cookies();
        //下面输出的是cookie 的内容
        for (String s : map.keySet()) {
            System.out.println(s + "=====-----" + map.get(s));
        }

        System.out.println(login.body());
        /**
         * 登录之后模拟获取预约记录
         *
         * */
        Connection con_record = Jsoup
                .connect("http://lib???.?????????.aspx");// 获取连接
        con_record.header("User-Agent",
                "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0");// 配置模拟浏览器
        con_record.cookies(datas);

        Response record = con_record.ignoreContentType(true)
                .method(Method.GET)
                .cookies(rs.cookies())
                .execute();
        System.out.println(record.body());
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

说文科技

看书人不妨赏个酒钱?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值