python实现广东省考实时报名人数爬取

最新推荐文章于 2024-03-25 20:58:05 发布

chenzhh25

最新推荐文章于 2024-03-25 20:58:05 发布

阅读量1.6k

点赞数

分类专栏： Python 考公文章标签：数据分析 python

本文链接：https://blog.csdn.net/chenzhh25/article/details/121678838

版权

话不多说，直接上代码

#!/usr/bin/env python
# -*- coding:utf-8 -*-

import os
import time
import json
import math
import random
import requests
import pandas as pd


class GDSK:
    """广东省考报名人数实时爬取"""
    def __init__(self):
        self.url = 'https://ggfw.gdhrss.gov.cn/gwyks/exam/details/spQuery.do'
        self.headers = {
            'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
            'Cookie': 'xxxxxxxxxxx',  # 爬取数据前，需要登录账号后，复制新的cookie过来
            'User-Agent': 'Mozilla/5.0xxx',  # 浏览器ua，需要更新为你的浏览器
        }

    def get_one_page_to_txt(self, num, rows, city, path):
        """
        爬取一页的信息，并保存为txt文件
        num: 需要爬取的页码
        rows: 每页记录数
        city: 需要爬取的城市
        path: txt文件存储的路径
        """
        # 不同城市，编码不同
        if city == '省直':

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chenzhh25

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python实现广东省考实时报名人数爬取

话不多说，直接上代码#!/usr/bin/env python# -*- coding:utf-8 -*-import osimport timeimport jsonimport mathimport randomimport requestsimport pandas as pdclass GDSK: """广东省考报名人数实时爬取""" def __init__(self): self.url = 'https://ggfw.gdhrss.
复制链接

扫一扫