数据分析师岗位 分析可视化

本文通过Python的pandas库对招聘平台上的数据分析师岗位信息进行处理,包括数据清洗、缺失值处理和重复值删除。接着使用Pyecharts进行数据可视化,展示了各地区招聘数量、平均工资排名、经验学历需求分布以及招聘公司所属领域,揭示了数据分析师岗位的市场需求和特点。
摘要由CSDN通过智能技术生成

目录

前言

一、导入模块

二、数据处理与分析

1.读取数据

2.查看数据表格描述

3.处理重复值

4.处理缺失值

5.提取地区信息 

6.提取经验信息

7.提取薪资信息

三、Pyecharts数据可视化

1.每个地区的招聘数量 

2.平均工资最高的地区 

3.经验学历需求图

4.招聘公司所在领域



前言

本文基于某招聘平台的数据分析师岗位招聘信息,首先利用pandas对数据进行处理与分析,然后利用pyecharts对各地区的招聘数量、平均工资、经验学历需求和招聘公司所在领域进行可视化的制图。



一、导入模块

import numpy as np
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
from pyecharts.globals import ThemeType

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'


二、数据处理与分析


1.读取数据

df = pd.read_csv('xx直聘 数据分析师岗位 分析可视化/xx直聘数据分析师.csv')
df.head()


2.查看数据表格描述

df.info() #查看整体性描述

df.describe()

 在这里发现count“福利”的后面几行是不满300的,说明数据缺失,要对缺失值进行处理。

3.处理重复值

df.duplicated().sum() #查看重复值

表面存在3处重复值。下面将重复值删除。

df.drop_duplicates(inplace = True) #删除重复值

4.处理缺失值

df.isnull().sum() #查看空值

df[df['福利'].isnull()] #查看“福利”空值所属信息
df['福利'].fillna('无', inplace=True) #用“无”填充福利列空值

“福利”列空值有26个,查看数值为空的列,用“无”将其填充。

df.rename(columns={'tags1':'涉及1','tags2':'涉及2','tags3':'涉及3','tags4':'涉及4','tags5':'涉及5','tags6':'涉及6'},inplace=True) #选择性重命名列名
df

  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值