爬取猎聘网招聘信息

最新推荐文章于 2024-05-01 21:41:23 发布

英雄＆萌萌

最新推荐文章于 2024-05-01 21:41:23 发布

阅读量1k

点赞数

文章标签：爬虫

本文链接：https://blog.csdn.net/weixin_43323333/article/details/90170941

版权

进入猎聘网首页获取六个大分类网址
进入六个分类获取每个职位网址
进入每个职位招聘信息网站获取第一个招聘信息（如果需要所有的话或者前几个需要修改一下正则表达式）
代码是存入mongodb
若不会配置或者没有mongodb
就不用那个函数
改为我注释的那好几行存为csv文件

import requests 
import re
import time
import csv
import pymongo
from requests.exceptions import RequestException  
from lxml import etree
def pipei(url):#获取信息
    html=gethtml(url)
    pattern=re.compile('<ul class="sojob-list">.*?li>.*?<div class="sojob-item-main clearfix.*?div class="job-info".*?h3 title="(.*?)">.*?class="text-warning">(.*?)</span>.*?area.*?>(.*?)</.*?span class="edu">(.*?)</span>.*?an>(.*?)</span>.*?<div class="company-info nohover">.*?class="company-name">.*?a.*?>(.*?)</a>.*?<p class="field-financing">.*?an.*?a class="industry-link" href=.*?>(.*?)</a>&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

英雄＆萌萌

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬取猎聘网招聘信息

进入猎聘网首页获取六个大分类网址进入六个分类获取每个职位网址进入每个职位招聘信息网站获取第一个招聘信息（如果需要所有的话或者前几个需要修改一下正则表达式）代码是存入mongodb若不会配置或者没有mongodb就不用那个函数改为我注释的那好几行存为csv文件import requests import reimport timeimport csvimport pymong...
复制链接

扫一扫