python爬取51job网络安全方面数据

本文介绍了如何使用Python爬虫从51job网站抓取网络安全领域的职位信息。通过引入相关库,构造请求头,获取页面链接,解析网页源码,异常处理,最终将数据保存到Excel表格。爬虫是搜索引擎的关键部分,Python提供便利的数据处理工具。
摘要由CSDN通过智能技术生成

文章目录

前言

一、python爬虫是什么?

二、使用步骤

1.引入库

2.构造请求头

3.获取岗位链接地址列表

4.获取网页源码

5.获取需要的岗位信息--进行异常捕获

6.保存需要的岗位信息到excel表中

7.main

总结

前言


爬取51job网站网络安全方面的数据-----不喜勿喷


以下是本篇文章正文内容,下面案例可供参考

一、python爬虫是什么?

网络爬虫是一种自动获取网页内容的程序,是搜索引擎的重要组成部分。

二、使用步骤

1.引入库

import openpyxl
import bs4
import requests as r
import re
import threading[1]

2.构造请求头

h = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:8\
8.0) Gecko/20100101 Firefox/88.0"}

3.获取岗位链接地址列表

def get_joburllist(): 
    joburllist = [] 
    for i in range(1,34): 
        i += 1 
        url = "https://search.51job.com/list/010000,000000,0000,0\                            0,9,99,%E7%BD%91%E7%BB%9C%E5%AE%89%E5%85%A8,2,{}.html".format(i) 
        html = get_html(u
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值