Drissionpage采集Boss直聘数据

前言:

        推荐一个把自动化和爬虫进行完美结合的框架DP库,目前是属于一个开源阶段,非常适合一些正在学习逆向但是基础又不算很好的朋友,他兼备爬虫的高效率和自动化的便捷易懂。具体的开发文档我放在下面了。这个技术在圈内现在是引发了一个热潮,像是瑞数加密和cloudflare都可以用他来解决!

注意事项:如果你的dp再采集数据过程中一直未响应,建议直接升级更新一下

https://drissionpage.cn/get_start/installationicon-default.png?t=N7T8https://drissionpage.cn/get_start/installation

我们用它来简单的去抓取下boss直聘平台的基本简历要求信息!

详细步骤:

进入详情列表页访问网站!执行的结果,不被平台检测!还会持续保持登录状态,不需要处理boss的加密参数Zp_token。

from DrissionPage import ChromiumPage
cp = ChromiumPage()
cp.get('https://www.zhipin.com/web/geek/job?query=python&city=100010000')

f12进行接口文档搜索  然后选择其中的部分参数 进行数据监听

 然后你千思万想的数据就这么干下来了!都感觉以前做boss搁几天就给这程序改脚本的操作真的是一坨。。。

然后基本的数据就可以直接这样获取到了

再补充一个简单的翻页操作,喜欢的朋友可以学起来,适用面很广哦!

from DrissionPage import ChromiumPage
import csv

f = open('boss直聘.csv', 'w', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
    '招聘HR',
    '工作岗位',
    '工作城市',
    '薪资待遇',
    '学历要求',
    '公司',
    '公司规模',
])
csv_writer.writeheader()
num = input('请输入你要采集的页码:')
cp = ChromiumPage()
cp.get('https://www.zhipin.com/web/geek/job?query=python&city=100010000')
for page in range(1, int(num)):
    print(f'正在采集第{page}页数据'.center(50, '-'))
    # 监听数据
    cp.listen.start('scene=1&query=python&city=100010000&experience=&payType=&partTime=&')
    # 等待监听响应
    response = cp.listen.wait().response
    resp = response.body
    # print(resp)
    # 采集数据
    jobList = resp['zpData']['jobList']
    for job in jobList:
        dict = {
            '招聘HR': job['bossName'],
            '工作岗位': job['jobName'],
            '工作城市': job['cityName'],
            '薪资待遇': job['salaryDesc'],
            '学历要求': job['jobDegree'],
            '公司': job['brandName'],
            '公司规模': job['brandScaleName'],
        }
        print(dict)
        csv_writer.writerow(dict)
    cp.ele('css:.ui-icon-arrow-right').click()

  • 13
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值