python招聘广州黄埔_小案例:用Pandas分析招聘网Python岗位信息

小案例: Python岗位分析_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili​www.bilibili.com

1. 读取数据

import pandas as pd

import numpy as np

df = pd.read_csv('data/Jobs.csv')

df.head(2)

# 总数

len(df)

356

2. 新增city字段

df['job_area'].unique()

array(['深圳·南山区', '深圳·龙岗区', '深圳', '深圳·福田区', '深圳·光明区', '深圳·龙华区', '深圳·宝安区',

'job_area', '北京', '北京·朝阳区', '北京·海淀区', '北京·通州区', '北京·东城区', '北京·丰台区',

'北京·大兴区', '北京·昌平区', '北京·西城区', '上海', '上海·杨浦区', '上海·浦东新区', '上海·徐汇区',

'上海·长宁区', '上海·青浦区', '上海·静安区', '上海·普陀区', '上海·黄浦区', '上海·闵行区',

'上海·虹口区', '上海·松江区', '广州·增城区', '广州·黄埔区', '广州·越秀区', '广州·番禺区',

'广州·天河区', '广州', '广州·海珠区', '广州·荔湾区', '广州·白云区'], dtype=object)

def extract_city(job_area):

if '深圳' in job_area:

return '深圳'

elif '广州' in job_area:

return '广州'

elif '北京' in job_area:

return '北京'

elif '上海' in job_area:

return '上海'

else:

return None

extract_city('上海-静安区')

'上海'

df['job_area'].apply(extract_city)

0 深圳

1 深圳

2 深圳

3 深圳

4 深圳

..

351 广州

352 广州

353 广州

354 广州

355 广州

Name: job_area, Length: 356, dtype: object

df['city']=df['job_area'].apply(extract_city)

df.head(2)

3. 三个字段公用一个apply函数salary

experience

population

步骤:正则表达式抽取出数字列表

求均值

import re

text = '300-1000人'

def avg(text):

nums = re.findall('\d+', text)

nums = [float(x) for x in nums]

if nums:

return np.mean(nums)

else:

return 0

avg('300-1000人')

650.0

4. 薪资

salary

df['new_salary'] = df['salary'].apply(avg)

df.head(2)

5. 工作年限

experience

df['experience'].apply(avg)

0 2.0

1 4.0

2 0.0

3 7.5

4 4.0

...

351 4.0

352 2.0

353 6.0

354 4.0

355 0.0

Name: experience, Length: 356, dtype: float64

df['new_experience'] = df['experience'].apply(avg)

df.head(2)

6. 员工人数

population

df['population'].apply(avg)

0 10000.0

1 10000.0

2 10000.0

3 10000.0

4 10000.0

...

351 299.5

352 59.5

353 59.5

354 299.5

355 10.0

Name: population, Length: 356, dtype: float64

df['new_population'] = df['population'].apply(avg)

df.head(2)

7. 教育设计一个函数,出现正规学历,返回True(包括”不限“)

使用逻辑索引,把正规学历的招聘信息都保留

df['edu'].unique()

array(['本科', '博士', '硕士', '大专', '不限', 'edu', '6个月', '3个月', '7个月', '4天/周'],

dtype=object)

def edu_bool(level):

if level in ['本科', '博士', '硕士', '大专', '不限']:

return True

else:

return False

edu_bool('博士')

True

df['Edu_bool'] = df['edu'].apply(edu_bool)

df.head(2)

# 逻辑索引

new_df = df[df['Edu_bool']==True]

new_df.head(2)

8. 城市/薪酬关系

city/salary

会用到df.groupby

new_df.groupby('city').mean()

9. 学历/薪酬关系

edu/salary

会用到df.groupby

new_df.groupby('edu').mean()

10. 城市/学历/薪酬关系

透视表

pd.pivot_table(df, index, columns, values, aggfunc, margins)

pd.pivot_table(new_df,

index='city',

columns='edu',

values='new_salary',

aggfunc=np.mean,

margins=True)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
系统根据B/S,即所谓的电脑浏览器/网络服务器方式,运用Java技术性,挑选MySQL作为后台系统。系统主要包含对客服聊天管理、字典表管理、公告信息管理、金融工具管理、金融工具收藏管理、金融工具银行卡管理、借款管理、理财产品管理、理财产品收藏管理、理财产品银行卡管理、理财银行卡信息管理、银行卡管理、存款管理、银行卡记录管理、取款管理、转账管理、用户管理、员工管理等功能模块。 文中重点介绍了银行管理的专业技术发展背景和发展状况,随后遵照软件传统式研发流程,最先挑选适用思维和语言软件开发平台,依据需求分析报告模块和设计数据库结构,再根据系统功能模块的设计制作系统功能模块图、流程表和E-R图。随后设计架构以及编写代码,并实现系统能模块。最终基本完成系统检测和功能测试。结果显示,该系统能够实现所需要的作用,工作状态没有明显缺陷。 系统登录功能是程序必不可少的功能,在登录页面必填的数据有两项,一项就是账号,另一项数据就是密码,当管理员正确填写并提交这二者数据之后,管理员就可以进入系统后台功能操作区。进入银行卡列表,管理员可以进行查看列表、模糊搜索以及相关维护等操作。用户进入系统可以查看公告和模糊搜索公告信息、也可以进行公告维护操作。理财产品管理页面,管理员可以进行查看列表、模糊搜索以及相关维护等操作。产品类型管理页面,此页面提供给管理员的功能有:新增产品类型,修改产品类型,删除产品类型。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值