python爬取51job网络安全方面数据

最新推荐文章于 2022-04-16 07:49:53 发布

Elaborate·

最新推荐文章于 2022-04-16 07:49:53 发布

阅读量459

点赞数

分类专栏：爬虫文章标签： python

本文链接：https://blog.csdn.net/weixin_47614445/article/details/118728345

版权

本文介绍了如何使用Python爬虫从51job网站抓取网络安全领域的职位信息。通过引入相关库，构造请求头，获取页面链接，解析网页源码，异常处理，最终将数据保存到Excel表格。爬虫是搜索引擎的关键部分，Python提供便利的数据处理工具。

摘要由CSDN通过智能技术生成

前言

爬取51job网站网络安全方面的数据-----不喜勿喷

以下是本篇文章正文内容，下面案例可供参考

一、python爬虫是什么？

网络爬虫是一种自动获取网页内容的程序，是搜索引擎的重要组成部分。

二、使用步骤

1.引入库

import openpyxl
import bs4
import requests as r
import re
import threading[1]

2.构造请求头

h = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:8\
8.0) Gecko/20100101 Firefox/88.0"}

3.获取岗位链接地址列表

def get_joburllist(): 
    joburllist = [] 
    for i in range(1,34): 
        i += 1 
        url = "https://search.51job.com/list/010000,000000,0000,0\                            0,9,99,%E7%BD%91%E7%BB%9C%E5%AE%89%E5%85%A8,2,{}.html".format(i) 
        html = get_html(u