选定关键词爬取智联招聘职位概览信息

最新推荐文章于 2024-09-11 15:08:10 发布

张煊信

最新推荐文章于 2024-09-11 15:08:10 发布

阅读量783

点赞数

分类专栏： Python文档文章标签：爬虫

本文链接：https://blog.csdn.net/JDMXI/article/details/95764022

版权

该博客主要介绍了如何构建爬虫主体文件，详细步骤包括存储爬取的职位信息到数据库，通过独立运行文件生成数据库，并进一步完善实现通过命令行参数执行爬虫文件。

摘要由CSDN通过智能技术生成

爬虫主体文件

zhaopin.py

import requests
import json
import time
import random
from getProduce.conn_sqlite import *    # 这个地方需要自己修改


def get_overview():
    kw = ['python', 'python开发', 'python工程师', 'python开发工程师', 'python爬虫工程师',
          'python后端', 'python程序员', 'python大数据', '数据挖掘', '电商']
    for w in kw:
        err = 0
        for i in range(200):
            url = """https://fe-api.zhaopin.com/c/i/sou?start={}&pageSize=90&
            cityId=765&salary=0,0&workExperience=-1&education=-1&companyType=-1&
            employmentType=-1&jobWelfareTag=-1&kw={}+&kt=3&=0&_v=0.61279220&
            x-zp-page-request-id=20d2e31b40a649bbbf6ca46fe60fec3a-1562948729116-749702&
            x-zp-client-id=91cbfd33-9b39-4114-9301-b53b6d1ba53d
            """.format(90 * i, w)
            if i == 0:
                url = """https://fe-api.zhaopin.com/c/i/sou?pageSize=90&
                cityId=765&workExperience=-1&education=-1&companyType=-1&
                employmentType=-1&jobWelfareTag=-1&kw={}+&kt=3&_v=0.71451964&
                x-zp-page-request-id=8