这样的Python爬虫项目谁不爱呢——Python爬取高校就业职位

本文介绍了一个Python爬虫项目,用于爬取江苏省高校就业网站上的职位信息。通过分析页面结构,发现多个高校职位列表页的HTML代码一致,从而实现了一次编写,多次爬取的效果。项目还实现了通过控制台打印、Windows气泡通知和微信好友通知三种方式发送职位更新提醒。
摘要由CSDN通过智能技术生成

大家好,这里是为代码封神的封神榜(有点吹牛皮了,哈哈)。还是新人初来乍到,希望大家多多指教。

本系列呢,是为大家带来的是一些爬虫小项目,希望大家能够喜欢,多多支持。

1 爬取职位信息

确定爬取的思路

该项目里爬取的都是江苏省高校,并且不止一个。爬取数据的入口是江苏省的某就业平台(http://www.91job.org.cn/default/schoollist)

在这里插入图片描述

该页面收录了江苏省各市 160 多所高校的就业网站。从这里点进去每个站点里的内容,跟各高校官网的就业信息站点的内容是一样的,以南京师范大学为例:
在这里插入图片描述
在这里插入图片描述

可以看到,除了url不同外,内容是一样的。这就带来了一个好处是,我们想爬取多个高校的就业信息,不用去每个高校官网找内容,直接到这个网站找就可以了,并且url格式也是固定的 “高校英文.91job.org.cn”。

这还不是最牛的,最牛的是每个高校的职位列

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值