【爬虫入门】【Json】爬取智联招聘

最新推荐文章于 2024-05-10 04:01:36 发布

F_aF_a

最新推荐文章于 2024-05-10 04:01:36 发布

阅读量773

点赞数

分类专栏： Python # 爬虫

本文链接：https://blog.csdn.net/qq_37252519/article/details/86160337

版权

Python 同时被 2 个专栏收录

40 篇文章 0 订阅

订阅专栏

爬虫

14 篇文章 0 订阅

订阅专栏

爬虫中也会经常会遇到以JSON数据返回内容的网站，这种网站不再需要使用正则表达式匹配文本，直接分析网站是否含有接口返回JSON，如果有，直接使用json.load()对json字符串进行解析就可以获取数据。

# pip install requests:比较流行的第三方请求库
#https://sou.zhaopin.com/?jl=489
import requests

response = requests.get(
    'https://fe-api.zhaopin.com/c/i/sou?pageSize=90&cityId=489&workExperience=-1&education=-1&companyType=-1&employmentType=-1&jobWelfareTag=-1&kw=Python&kt=3&_v=0.75128621&x-zp-page-request-id=7fb624a59a8f4d159eb1fed53c1456a0-1547017702231-449925')
    
print(response)
# 响应状态码：GET请求成功的响应码的200；POST：成功状态码是201；
# 400、401、403、404等以4开头的状态码代表程序代码有问题
# 500、501、502、505等以5开头的状态码代表网站的服务器有问题，跟代码关系不大

json_str = response.text
# json字符串：
"""
{
    "code":200,
    "data":[
    {"a":1},
    {"a":1},
    {"a":1}
    ]
}
"""
import json

# json_dict是最外层的字典，内部有两个键值对
# code：200和data：{...}
json_dict = json.loads(json_str)

data_dict = json_dict['data']

results = data_dict['results']

for item_dict in results:
    city = item_dict['city']['display']
    company = item_dict['company']['name']
    edu = item_dict['eduLevel']['name']
    job_name = item_dict['jobName']
    job_type = item_dict['jobType']['display']
    #';'.join():使用;字符将列表张的每一个元素拼接起来，得到一个字符串
    welfare = ';'.join(item_dict['welfare'])
    woekingExp=item_dict['workingExp']['name']

    print('城市：{};公司名称：{};学历要求:{};招聘职位:{};职位类型:{};福利待遇:{};工作经验:{}'.format(city,company,edu,job_name,job_type,welfare,woekingExp))

F_aF_a

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【爬虫入门】【Json】爬取智联招聘

爬虫中也会经常会遇到以JSON数据返回内容的网站，这种网站不再需要使用正则表达式匹配文本，直接分析网站是否含有接口返回JSON，如果有，直接使用json.load()对json字符串进行解析就可以获取数据。# pip install requests:比较流行的第三方请求库#https://sou.zhaopin.com/?jl=489import requestsresponse = ...
复制链接

扫一扫

专栏目录