Python数据分析(6)----招聘信息数据分析

本次实验内容为餐饮订单数据的分析,数据请见:https://pan.baidu.com/s/1tL7FE5lxs-gb6Phf8XRu_Q,文件夹:data_analysis,下面的文件:job_info.csv 本次实验主要是对python中的数据进行基本操作。

代码为:

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
import pandas as pd
import re

# 招聘数据探索与分析
# 1. 读取数据并存为一个名叫job_info的数据框。此处encoding='GBK'语句是为了读取中文
job_info = pd.read_csv('data_analysis/job_info.csv', encoding='GBK', header=None)
# 2. 将列命名为:['公司', '岗位', '工作地点', '工资', '发布日期']。
job_info.columns = ['公司', '岗位', '工作地点', '工资', '发布日期']
# 3. 哪个岗位招聘需求最多?
job_info['岗位'].value_counts().idxmax()

# 4. 取出9月3日发布的招聘信息。
job_info['发布日期'].value_counts()    #频次统计
job_info[job_info['发布日期'] == '09-03']
job_info.loc[job_info['发布日期'] == '09-03', :]

# 5. 找出工作地点在深圳的数据分析师招聘信息。
index1 = job_info['工作地点'].apply(lambda x: '深圳' in x)   #工作地点包含 '深圳'这两个字的索引
index2 = job_info['岗位'] == '数据分析师'
job_info.loc[index1 & index2, :]

# 6. 取出每个岗位的最低工资与最高工资,单位为“元/月”,若招聘信息中无工资数据则无需处理。(如2-2.5万/月,则最低工资为20000,最高工资为25000。)
job_info['工资'].str[-3].value_counts()    #只处理一下按年和按月给工资的
#string = '2-3.5万/月'
def get_number(string =None):
    try:
        if string[-3] == '万':
            x = [float(i)*10000 for i in re.findall('\d+\.{0,1}\d*', string)]
        elif string[-3] == '千':
            x = [float(i)*1000 for i in re.findall('\d+\.{0,1}\d*', string)]
        if string[-1] == '年':
            x = [i/12 for i in x]
        return x
    except:
        return None
job_info['最低月薪']=job_info['工资'].apply(get_number).str[0]
job_info['最高月薪']=job_info['工资'].apply(get_number).str[1]   #apply只能加函数名,不能加参数


文件‘job_info.csv’中的数据截图为:
在这里插入图片描述

运行结果如图:
在这里插入图片描述

注意,本例中重点运用了python中的正则表达式模块re来辅助处理‘工资’这一列数据,要留意其中对不同单位的薪资的处理方式。

  • 11
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Python是一种功能强大的编程语言,广泛应用于数据分析领域。而Spring Boot是一种Java开发框架,用于构建快速、高效的后端接口。结合这两个技术,我们可以实现招聘信息的可视化分析。 首先,我们需要收集和处理招聘信息数据。可以使用Python的网络爬虫库去爬取各大招聘网站上的数据,并存储到数据库中。为了方便存储和查询,可以选择使用MySQL或者MongoDB等数据库。 接下来,我们可以使用Python中的数据处理和分析库,例如Pandas和Numpy,对招聘数据进行清洗和整理。去除重复数据、格式化数据等,确保数据的准确性和一致性。 然后,我们可以使用Python数据可视化库,如Matplotlib和Seaborn,来创建图表和可视化工具,将招聘信息进行可视化展示。可以根据需求绘制各种图表,例如饼图、线图、柱形图等,展示各种招聘信息的分布和趋势。 此外,借助Spring Boot的接口开发能力,我们可以将这些数据可视化的图表和工具嵌入到一个Web应用中。通过编写接口,前端页面可以从后端获取招聘数据并调用数据可视化工具,将结果以图表的形式展示给用户。用户可以通过搜索、过滤等方式与数据进行交互,从而获得更加丰富和深入的招聘信息。 总之,结合Python数据分析和Spring Boot接口开发,我们可以实现招聘信息的可视化展示。这有助于招聘人员和求职者更好地了解当前的招聘市场,提供决策支持和参考。同时,也提升了用户对招聘信息的可视化分析能力,帮助他们更好地了解行业动态和就业趋势。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值