python爬取大学生就业分析专科和本科的信息https://edu.jobui.com/major/（上）JSON的存储

文轩程序员

已于 2022-12-05 09:21:52 修改

阅读量843

点赞数

分类专栏： python爬虫文章标签： json python

于 2022-12-05 08:50:27 首次发布

本文链接：https://blog.csdn.net/m0_71198559/article/details/128180524

版权

该博客介绍了使用Python爬虫获取并分析大学生就业数据的过程，包括爬取URL、解析HTML、存储数据到JSON文件。数据展示了不同专业的就业指数，如工程管理、计算机科学与技术、英语等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一，爬虫步骤
1.导入模块json,requests,lxml
2.url地址
3,请求头
4.get请求 200正常访问
5.解码
6.找到节点
7.创建一个存储所有信息的列表
8.循环遍历li节点
9.创建一个字典来存储每个li的内容
10.找到要爬取的内容将它们存储到字典里面
11.将每个字典存储到列表里面
12.将列表存储到JSON文件里面
13.爬取完成提示

二，爬虫源代码

import json
import requests as r
from lxml import etree

url = 'https://edu.jobui.com/major/'
hea = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                     'AppleWebKit/537.36 (KHTML, like Gecko) '
                     'Chrome/107.0.0.0 Safari/537.36 Edg/107.0.1418.42'}
rel = r.get(url, headers=hea)
# print(rel)
cenet = rel.content.decode()
# print(cenet)
html = etree.HTML(cenet)
list_ol = html.xpath(".//ol[@class='tblist-list']/li")
list_xx = []
for ol in list_ol:
    d = {}
    zhuany = ol.xpath("a[@class='

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

文轩程序员

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python爬虫项目（八十六）：爬取全球就业数据，分析就业市场变化趋势

sybh的博客

10-05

967

在items.py中定义，以存储爬取的就业数据。country_name = scrapy.Field() # 国家名称employment_rate = scrapy.Field() # 就业率industry_distribution = scrapy.Field() # 行业分布salary_level = scrapy.Field() # 薪资水平year = scrapy.Field() # 数据年份本文详细介绍了如何爬取全球就业数据，分析就业市场的变化趋势。

这样的Python爬虫项目谁不爱呢——Python爬取高校就业职位

Python4857的博客

11-11

1731

大家好，这里是为代码封神的封神榜（有点吹牛皮了，哈哈）。还是新人初来乍到，希望大家多多指教。本系列呢，是为大家带来的是一些爬虫小项目，希望大家能够喜欢，多多支持。 1 爬取职位信息确定爬取的思路该项目里爬取的都是江苏省高校，并且不止一个。爬取数据的入口是江苏省的某就业平台（http://www.91job.org.cn/default/schoollist）该页面收录了江苏省各市 160 多所高校的就业网站。从这里点进去每个站点里的内容，跟各高校官网的就业信息站点的内容是一样的，以南京师范大学为例

1 条评论您还未登录，请先登录后发表或查看评论

(附源码)计算机毕业设计ssm大学生就业分析系统

计算机程序_设计

10-06

1006

页面中查看企业编号、企业名称、招聘职位、申请时间、申请说明、简历文件、账号、姓名、审核回复、审核状态、审核等内容进行修改、删除等操作，页面中查看企业编号、企业名称、招聘职位、申请时间、申请说明、简历文件、账号、姓名、审核回复、审核状态等内容，进行修改、删除等操作，页面中可以查看企业编号、企业名称、招聘职位、申请时间、申请说明、简历文件、账号、姓名、审核回复、审核状态等内容，并进行。页面中可以查看企业编号、企业名称、招聘职位、联系电话、发布日期、企业封面、审核回复、审核状态、审核等内容，并进行。

(附源码)计算机毕业设计ssm大学生就业信息检索系统

计算机程序_设计

10-06

723

项目运行环境配置：（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：等等组成，B/S模式 + Maven管理等等。环境需要1.运行环境：最好是java jdk 1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境：IDEA，Eclipse,Myeclipse都可以。推荐IDEA;3.tomcat环境：Tomcat 7.x,8.x,9.x版本均可4.

案例▍用Python爬取数据来分析 2019年金三银四 Python就业行情

36大数据

03-20

1188

作者|梦想橡皮擦编辑|丹顶鹤5号 36大数据已获授权用Python 解决Python就业的问题最近Python大热，就想要分析一下相关的市场需求，看一下Python到...

python爬大学生就业数据分析_Python 网络爬虫数据分析实战

weixin_39819671的博客

01-13

2479

适用人群即将毕业的大学生；频繁手工获取数据录入员；在职数据分析师；零基础对数据感兴趣却无从下手的人……课程概述有意向转行/跳槽/技能升级/应届毕业生入职数据分析的入职数据分析，不可不知的一些职场"门道"购课价值超过100元可提供纸质发票，邮寄到付。课程简介/收获：Python 作为一门面向对象的编程语言，简洁的语法使得编写数十行代码即可实现爬虫功能，获取海量互联网数据。python 就业的几大优势...

python爬历年大学生就业数据_2018 年大学生就业形势数据分析报告.PDF

weixin_39898150的博客

11-29

622

2018 年大学生就业形势数据分析报告报告人：刘磊2018 年5 月目录一、就业分析二、薪资分析三、应届生对企业的需求分析四、数据来源五、总结一、就业分析1. 就业形势不容乐观教育部预估2018 年高校毕业人数约为820 万人，同比增加25 万人。2018年 1-2 月全国新增城镇就业 176 万人，同比下降 12 万人；城镇失业人员再就业70 万人，同比减少5 万人；就业困难人员24...

python爬大学生就业数据_小猪的Python学习之旅 —— 16.再尝Python数据分析：采集拉勾网数据分析Android就业行情...

weixin_39722375的博客

11-29

776

一句话概括本文：爬取拉钩Android职位相关数据，利用numpy，pandas和matplotlib对招人公司情况和招聘要求进行数据分析。引言：在写完上一篇《浅尝Python数据分析：分析2018政府工作报告中的高频词》，一直都处于一种亢奋的状态，满脑子都想着数据分析，膜一下当然很开心，更重要的是感受到了Python数据分析的好玩，迫不及待地想写个新的东西玩玩，这不，给我翻到一个好玩的东西：《P...

python爬大学生就业信息报告_Python程序员招聘市场简要报告

weixin_39520393的博客

12-01

162

python部落原创，禁止转载，欢迎转发近期，Python小助理整理了前程无忧上面Python程序员招聘的信息。搜集了150家公司的Python程序员招聘信息，整理成表格。今天，小编根据表格的数据绘制了两张统计图，分享给大家，并讲解一下这两张图的含义。1、不同薪资水平上，提供Python开发岗位的公司数量。图中横轴是薪资水平(月薪)，每隔2000元做一个测量点。纵轴是在该测量点上，提供Python...

数据分析毕业设计大数据招聘岗位数据分析与可视化 - 爬虫 python

kooerr的博客

04-06

2950

该项目一共分为三个子任务完成，数据采集—数据预处理—数据分析/可视化。项目流程图项目架构图Flask是一个基于Werkzeug和Jinja2的轻量级Web应用程序框架。与其他同类型框架相比，Flask的灵活性、轻便性和安全性更高，而且容易上手，它可以与MVC模式很好地结合进行开发。Flask也有强大的定制性，开发者可以依据实际需要增加相应的功能，在实现丰富的功能和扩展的同时能够保证核心功能的简单。Flask丰富的插件库能够让用户实现网站定制的个性化，从而开发出功能强大的网站。

python爬大学生就业形势_Python爬虫：爬一下十月份的就业情况

weixin_33392336的博客

02-21

1000

不知不觉，十月份已经过去了，传说中的金九银十于是乎，我再次转战 Boss 直聘，我就是想看看，到底什么工种比较好找工作呢。当然了，这里工作种类实在是太多了，我就挑选出 Python，Java，获取数据我在前面就写过一篇获取 Boss 数据的由于defget_jobs(page,city,job_type):同时这里要注意的是，Boss 网站会检测浏览器是否在受 selenium 控制，所...

基于python的大学生就业推荐系统

1111

06-18

2086

网络招聘，一般也称为在线招聘或者是电子招聘，是指在借助互联网的应用，实现企业单位人事部完成招聘工作的一种新型模式，即企业或者事业单位通过企业的官方网站或者互联网的第三方招聘信息发布平台如智联、boss直聘、前程无忧等发布相应的招聘信息，然后通过电子邮件或者平台内部的简历数据库搜集应聘者的应聘信息,接着对简历进行初步筛选，再根据岗位实际需要安排相应的笔试和面试，最后确定聘用适合企业招聘岗位要求的岗位人选。

python对就业网站数据进行可视化分析

02-28

利用python对就业网站爬取的数据进行可视化分析

用python获取热门岗位信息，看看你离高薪还差哪些技能

人生苦短，还不用Python？

12-16

1787

话说年末了，有工作的要考虑明年跳槽，没工作的要考虑明年找工作，那么都想好怎么搞了吗？

Python就业行情和前景分析之一