前程无忧网数据分析报告

本文通过对51job上收集的10102条数据进行清洗和分析,揭示了广东省计算机行业的主要特点:民营公司占主导,计算机软件行业活跃;学历与薪资正相关,本科及大专为主流;3-4年工作经验更受青睐;广州薪资水平领先,其次是佛山和东莞;Java开发工程师最热门,Android和Web前端紧随其后;福利待遇主要包括五险一金和绩效奖金。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

大数据时代,数据分析如火如荼,计算机行业的前景如何?对工作经验有什么要求?个人优势在哪里?是否可以拿到期望薪资?本次将对广东省计算机相关领域的职业进行分析。

项目目的

  1. 了解计算机领域的公司类型
  2. 了解相关公司的主要行业类型
  3. 了解学历与薪资间的关系
  4. 了解工作经验对薪资的影响
  5. 了解目前掌握数据下广东省哪个市级的工资更高
  6. 了解计算机行业热门职位及技术
  7. 了解公司提供的福利待遇如何

环境

  1. 工具:PyCharm
  2. 数据清洗分析:pandas
  3. 数据可视化:pyechart,python-matplotlib

数据来源

  1. 数据来源:51job(https://search.51job.com)
  2. 采集时间:2021.11.17
  3. 数据采集工具:python-requests,random,time,json
  4. 有效数据样本:10102条

爬取过程

        一、爬取有关数据

def handledata_kw(supername,secondname,citycode):
    print(supername,secondname,citycode)
    time.sleep(1)
    golols = {"index":1}
    while True:
        time.sleep(random.uniform(1,6))
        golols["index"] += 1
        try:
            url = f'https://search.51job.com/list/{citycode},000000,0000,00,9,99,{golol_key},2,{golols["index"]}.html'
            print(url)
            res = requests.get(url,headers=headers, timeout=(50)).json()
        except Exception as e:
            print(e, "捕获第%d页异常" % golols["index"])
            continue
        alllist = res.get("engine_jds")
        if alllist  == None:
            print("当前分类无数据!")
            continue
        for idit in alllist:
            print(f"总页码:{res.get('total_page')}\t当前页码{res.get('curr_page')}",idit)
            try:
                newitem = {}
                newitem["id"] = str(idit.get('jobid')).replace(',', '')
                newitem["title"] = str(idit.get('job_name')).replace(',', '')
                newitem["public_t"] = str(idit.get('issuedate')).replace(',', '')
                newitem["prov"] = str(supername).replace(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值