利用Python爬取拉勾网招聘信息

本文介绍了如何使用Python进行网络爬虫,详细步骤包括导入所需库、模拟浏览器请求拉勾网的招聘信息数据、解析数据,并最终将数据保存到CSV文件中。注意,文章强调了代码仅供学习交流,不得用于非法用途。
摘要由CSDN通过智能技术生成


在这里插入图片描述

第一步:导入工具库

import requests,json,csv,time

第二步:爬取数据

因为拉勾使用异步加载方式对数据进行了封装,所以不能直接用requests库的getpost方法,而是使用session会话。

构建session会话

session = requests.session()

构建请求头

headers = {
   
    'referer' : 'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?&px=default&city=%E5%85%A8%E5%9B%B',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}

模拟浏览器向网站发起请求

session.get('https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/p-city_0?px=default',headers=headers)

模拟拉勾网请求内部数据

url = 'https://www.lagou.com/jobs/positionAjax.json?px=default&needAddtionalResult=false'
kd = input("请输入你想查找的岗位:")
for i in range(1,30):
    print(f'开始爬取第{i}页')
    data = {
   
        'first': 'false',
        'pn': str(i)
  • 4
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值