我爬取了爬虫岗位薪资,分析后发现爬虫真香!

本文作者闲逛招聘网站时发现爬虫岗位薪资诱人,决定爬取并分析。通过Python爬取相关数据,存储为CSV,然后进行数据可视化,包括岗位名称、城市分布和薪资情况。分析结果显示,大城市爬虫岗位需求大,薪资集中在20000以上,特别是20000左右的薪资占比高,展示了爬虫岗位的吸引力。
摘要由CSDN通过智能技术生成

闲着无事逛逛招聘网站,无意看到了爬虫岗位的薪资,发现真香,今天决定爬取下来并进行分析

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

 

首先,确定目标网站:

https://jobs.51job.com/pachongkaifa

1.开始

打开pycharm,新建文件->导入必备的库->加入常用的请求头header

  1. # 导入requests包

  2. import requests

  3. from lxml import etree

  4. # 网页链接

  5. url = "https://jobs.51job.com/pachongkaifa/p1/"

  6. # 请求头

  7. headers = {

  8. "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",

  9. "Accept-Encoding": "gzip, deflate, br",

  10. "Accept-Language": "zh-CN,zh;q=0.9",

  11. "Connection": "keep-alive",

  12. "Cookie": "guid=7e8a970a750a4e74ce237e74ba72856b; partner=blog_csdn_net",

  13. "Host": "jobs.51job.com",

  14. "Sec-Fetch-Dest": "document",

  15. "Sec-Fetch-Mode": "navigate",

  16. "Sec-Fetch-Site": "none",

  17. "Sec-Fetch-User": "?1",

  18. "Upgrade-Insecure-Requests": "1",

  19. "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36"

  20. }

 

2.分析目标网站的标签,发现想要的字段(岗位、公司名称、城市、薪资)都在p标签里面,如下图

<p class="info"&
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值