基于大数据的地域职位需求和薪资分析 毕业论文+源码及数据

!!! 有需要的小伙伴可以通过文章末尾名片咨询我哦!!!

 💕💕作者:小马
💕💕个人简介:混迹在java圈十年有余,擅长Java、微信小程序、Python、Android等,大家有这一块的问题可以一起交流!
💕💕各类成品java系统 。javaweb,ssh,ssm,springboot等等项目框架,源码丰富,欢迎咨询交流。学习资料、程序开发、技术解答、代码讲解、源码部署,需要请看文末联系方式。

摘 要

互联网市场很的繁荣,带动了很多招聘网站的产生。互联网市场技术的市场情况会很好的反映在招聘网站上。如果能够通过研究招聘网站对互联网技术进行研究,分析出它所在地区技能要求和薪资情况,那将会是一件特别有意义的事。

本系统主要完成的是基于大数据的地域职位需求和薪资分析的设计和实现,主要实现了以下几个功能,分别是数据爬取、数据清洗、数据存储、预测薪资、分词统计和数据呈现等功能。数据爬取采用 Python 语言,主要使用的模块有 requests、bs4 和 re 数据清洗系统使用 Hive 框架,代码放在.hql 的脚本中。数据存储系统使用 Hbase 框架,使用

Java 语言先从 Hive 读取数据,然后把读取到的数据存储到 Hbase 上。预测薪资算法采用 Java 语言实现,分词统计采用 Spark 框架,然后使用 Java 语言实现。数据呈现是使用 Java Web 搭建网站,后台使用 SSM 框架调用预测算法和分词算法,前端使用 EChars 呈现出使用预测算法和分词算法得到的结果。

本系统最终呈现的效果是一个网站,因为网站呈现出来的结果具备直观性和可观赏性,很方便用户查看。用户点击地图上的地区,就会出现相应地区的薪资预测图和该地区相应关键字对应的技能词的统计结果。

Analysis of Regional Job Requirements and Salary Based on Big Data Technology

Abstract

The Internet market is booming, which has led to the creation of many recruitment websites. The market situation of Internet market technology will be well reflected in the recruitment website. It would be especially interesting to be able to research Internet technology through research recruitment websites and analyze the skill requirements and salary levels in  its region.

This system mainly completes the design and implementation of regional job demand and salary analysis based on big data. It mainly realizes the following functions: data crawling, data cleaning, data storage, salary prediction, word segmentation statistics and data presentation. Data crawling is implemented in python language. The main modules used are requests, bs4 and re. The data cleaning system uses the hive framework, and the code is placed in the script of.Hql. Data storage system uses hbase framework, uses java language to read data from hive, and then stores the read data on hbase. The predictive salary algorithm is implemented in Java language, the word segmentation statistics is implemented in spark framework, and then implemented in Java language. Data presentation is to use java web to build websites, ssm framework is used in the background to call prediction algorithm and word segmentation algorithm, and echars is used in the front end to present the results obtained by using prediction algorithm and word segmentation algorithm.

The final effect of the system is a website, because the results presented by the website are intuitive and enjoyable, which is convenient for users to view. When the user clicks on the area on the map, the salary forecast map of the corresponding area and the statistical result of the skill word corresponding to the corresponding keyword in the area appear.

目 录

摘 要 I

ABSTRACT II

第 1 章 项目引言 1

1.1 项目背景 1

1.2 国内研究现状 1

1.3 研究内容 2

1.4 论文结构 2

第 2 章 项目框架 3

2.1 HADOOP 框架 3

2.2 HBASE 框架 4

2.3 HIVE 框架 5

2.4 SPARK 框架 6

第 3 章 项目设计 7

3.1 数据采集 7

3.1.1 爬虫简介 7

3.1.2 爬虫设计 7

3.2 数据清洗 10

3.1.1 数据清洗简介 10

3.2.2 数据清洗设计 11

3.3 数据存储 11

3.3.1 数据存储简介 11

3.3.2 数据存储设计 12

3.4 预测算法 12

3.1.1 预测算法简介 12

3.4.2 预测算法设计 13

3.5 分词算法 13

3.5.1 分词简介 13

3.5.2 分词设计 14

3.6 数据呈现 15

3.6.1 数据呈现简介 15

3.6.2 数据呈现设计 15

第 4 章 项目实现 16

4.1 数据采集 16

4.1.1 爬虫实现 16

4.1.2 爬取结果 18

4.2 数据清洗 19

4.2.1 数据清洗实现 19

4.2.2 数据清洗结果 20

4.3 数据存储 22

4.3.1 数据存储实现 22

4.3.2 数据存储结果 24

4.4 预测算法 24

4.4.1 预测算法实现 24

4.4.2 预测算法结果 26

4.5 分词算法 26

4.5.1 分词实现 26

4.5.2 分词结果 27

4.6 数据呈现 28

4.6.1 数据呈现实现 28

4.6.2 数据呈现结果 29

第 5 章 项目结论 31

参考文献 31

致 谢 33

更多项目:

另有1000+份项目源码,项目有java(包含springboot,ssm,jsp等),小程序,python,php,net等语言项目。项目均包含完整前后端源码,可正常运行!

!!! 有需要的小伙伴可以点击下方链接咨询我哦!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员小马软件开发定制

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值