python爬虫入门教程04：招聘信息爬取

最新推荐文章于 2024-06-30 12:05:08 发布

巫俊晤

最新推荐文章于 2024-06-30 12:05:08 发布

阅读量1k

点赞数 25

分类专栏： 2024年程序员学习文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wfegre/article/details/137234567

版权

本文介绍了如何使用Python爬虫抓取51job网站上的招聘信息，包括获取详情URL、页面转码、提取薪资、标题、公司、职位信息等，并对数据进行保存。通过解析网页内容，提取出城市、经验要求、学历要求、福利等关键信息，最终实现多页数据的爬取与存储。

摘要由CSDN通过智能技术生成

二、💥请求网页，先获取所有招聘信息的详情url地址

在这里插入图片描述

使用开发者工具发现网页加载出来的内容是乱代码的，这也意味着等会再爬取的时候，是需要转码的，这样看是看不出自己想要的内容网页是否有返回数据，可以复制网页中的数据，在网页源代码里面搜索。

在这里插入图片描述

没有结果，那么我们就可以搜索详情链接的ID

在这里插入图片描述

里面不仅有ID 还有详情url地址。用正则表达式匹配出ID，然后再拼接url，如果匹配出url地址的话，需要再转一次。

在这里插入图片描述

❤特别声明：❤

因为网站原因，每一个招聘详细页面url地址，仅仅只是ID的变化，如果ID不是唯一变化值的时候，那取url地址更好。

import requests

import re

def get_response(html_url):

headers = {

‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36’,

}

response = requests.get(url=html_url, headers=headers)

return response

def get_id(html_url):

response = get_response(html_url)

result = re.findall(‘“jobid”:“(\d+)”’, response.text)

print(response.text)

print(result)

if name == ‘main’:

url = ‘https://search.51job.com/list/010000%252C020000%252C0302

最低0.47元/天解锁文章

关注

25
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄2年

187
原创

2695
点赞

2608
收藏

2007
粉丝

关注

私信

热门文章

分类专栏

最新评论

java android面试分析，不断更新中，阿里java面试流程
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
Apache服务器修改最大连接数（并发数量），腾讯T2大佬手把手教你
CSDN-Ada助手: 恭喜用户发布了第四篇博客！标题《Apache服务器修改最大连接数（并发数量），腾讯T2大佬手把手教你》听起来就很吸引人啊！希望用户能够继续分享更多关于服务器优化的经验，让更多人受益。下一步可以考虑写一些实用的案例分享，或者深入探讨一些高级技术问题，为读者提供更多的学习内容。期待用户更多精彩的文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Go 专栏｜函数那些事，Python程序员如何有效提升学习效率
CSDN-Ada助手: 恭喜您撰写第5篇博客！标题看起来非常吸引人，对于Python程序员提升学习效率一定有很大帮助。希望您能继续分享更多有价值的内容，或许可以考虑深入探讨函数的高级用法或者与其他语言的函数对比分析，这样可以为读者带来更多启发和收获。期待您的下一篇作品！
3年经验面试腾讯java开发岗，调优都不会，凭什么月入20k
CSDN-Ada助手: 恭喜您写了第6篇博客！很高兴看到您对面试腾讯java开发岗的经验分享。不过，我觉得您对自己的调优能力可能有些过于自我要求了。不过，这也是一个学习的过程，希望您能够继续努力提升自己的技能。下一步，可以尝试写一些关于如何提升调优能力的分享，相信会对很多人有所帮助。期待您更多的创作！加油！
MySQL 到Oracle 实时数据同步实操分享，想提高开发效率的必看
CSDN-Ada助手: 恭喜作者第7篇博客发布成功！分享MySQL到Oracle实时数据同步实操经验，对于提高开发效率有着极大的帮助。建议作者可以继续分享更多实用的技术经验和心得体会，让更多开发者受益。期待作者的下一篇博客，再接再厉！愿您在创作的路上不断进步，谢谢您的分享！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。