java爬虫爬取动态页面使用ajax加载

本文以百度招聘为例,介绍如何分析动态页面的Ajax请求。通过F12开发者工具抓取网络请求,发现是GET请求,可以直接访问并调整参数获取所需数据。如果是POST请求,则需分析参数并模拟请求。文中并未展示具体代码,但提到了之前的博客中有相关模拟请求的内容。
摘要由CSDN通过智能技术生成

1.动态页面最主要的是分析,以百度的招聘为例,首先F12抓取看图点击clear清空net这样能够很好的抓取,之后点击分页操作查看请求

发现一个get请求,这样就很好了既然不是post 那就直接访问,发现百度并没有给做限制 ,可以直接访问,并且pagesize这个参数可以自己填无限大,当然如果数据多的话,可以写个循环直接让百度服务器down掉,但是咱们都是合法公民,就不让这样做了,爬取一下信息就可以了,如果是post 那就分析参数,模拟请求,我的以前博客有模拟请求的,好了,接下来上代码:

package com.learn;

import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.Connection.Response;
import org.jsoup.nodes.Document;
import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONArray;
import com.alibaba.fastjson.JSONObject;


public class PaBaidu {
	public static void main(String[] args) throws Exception {
		String url ="https://talent.baidu.com/baidu/web/httpservice/getPostList?r
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值