项目四:数据获取：腾讯招聘

最新推荐文章于 2023-12-31 19:08:12 发布

&黄焖鸡米饭&

最新推荐文章于 2023-12-31 19:08:12 发布

阅读量287

点赞数 2

分类专栏：数据分析爬虫练习笔记文章标签：大数据 python pycharm

本文链接：https://blog.csdn.net/qq_42066782/article/details/114185290

版权

数据分析同时被 3 个专栏收录

13 篇文章 3 订阅

订阅专栏

笔记

12 篇文章 0 订阅

订阅专栏

爬虫练习

4 篇文章 1 订阅

订阅专栏

爬取腾讯招聘

直接上代码

点击跳转到总目录
 本篇只记录程序点击跳转项目

直接上代码

因为数据少（相比于猎聘网），所以最后还是选取了爬取猎聘

# encoding: utf-8

import requests
import csv
import xlwt     #写入excel文件

url = "https://careers.tencent.com/tencentcareer/api/post/Query"

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36",
}

params = {'area': ' cn',
          'attrId': ' ',
          'bgIds': ' ',
          'categoryId': ' ',
          'cityId': ' ',
          'countryId': ' ',
          'keyword': ' ',
          'language': ' zh-cn',
          'pageIndex': ' 1',
          'pageSize': ' 10',
          'parentCategoryId': ' ',
          'productId': ' ',
          'timestamp': ' 1602211262824'}


def parse_json(url, params={}):
    """解析url，得到字典"""
    response = requests.get(url=url, headers=headers, params=params)
    return response.json()


def get_position(data):
    """获取职位数据"""
    item = {
        "postion_name": "",  # 职位名称
        "postion_department": "",  # 职位部门
        "postion_location": "",  # 职位所在地
        "postion_country": "",  # 职位所在国家
        "postion_category": "",  # 职位类别
        "postion_responsibility": "",  # 职位职责
        "postion_url": "",  # 职位url
    }
    data_list = data["Data"]["Posts"]
    for data in data_list:
        item["postion_name"] = data["RecruitPostName"]
        item["postion_department"] = data["BGName"]
        item["postion_location"] = data["LocationName"]
        item["postion_country"] = data["CountryName"]
        item["postion_category"] = data["CategoryName"]
        item["postion_responsibility"] = data["Responsibility"]
        item["postion_url"] = data["PostURL"]

        save(item)
        # print(item)
        # print("保存完成")


def save(item):
    """将数据保存到csv中"""
    with open("./腾讯招聘.xlsx", "a", encoding="utf-8") as file:
        writer = csv.writer(file)
        writer.writerow(item.values())
 

def start():
    for i in range(1, 635):
        params["pageIndex"] = i
        data = parse_json(url, params)
        get_position(data)


if __name__ == '__main__':
    start()

&黄焖鸡米饭&

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
项目四:数据获取：腾讯招聘

爬取腾讯招聘直接上代码点击跳转到总目录本篇只记录程序点击跳转项目直接上代码因为数据少（相比于猎聘网），所以最后还是选取了爬取猎聘# encoding: utf-8import requestsimport csvimport xlwt #写入excel文件url = "https://careers.tencent.com/tencentcareer/api/post/Query"headers = { "user-agent": "Mozilla/5.0 (W
复制链接

扫一扫