excel sql中如何将同一sheet中不同列的内容合并到同一列中_Excel数据分析实例

问题:了解目前杭州市“数据分析岗”的招聘情况。

  1. 数据获取

借助八爪鱼采集器中的免费模板,爬取拉勾网上杭州数据分析岗的数据,得到124条记录,保存csv文件。

3017ca7bc707d7487b025a2628a2f308.png
不宜直接对原始数据的sheet进行直接处理

为了不破坏原始数据,新建一个sheet副本进行操作,命名为“拉勾网-招聘信息(处理数据)”。由于职位描述中有个别字段内容过多,且主要是对于后续处理没有帮助,故选择删去该列。

之后全选数据——鼠标置于A列出,调整至合适列宽15(便于数据显示)。

选择“试图——冻结窗口——冻结首行”(无他,感jio很酷)。

最终调整之后如下:

a280accd85b04fb9c55c9eee9994be1d.png

2. 数据清洗

2.1 隐藏不必要的列

对于我们此次需要研究的问题而言,“工作地点、岗位属性、发布时间、职位诱惑、爬取时间”等列是不需要的,故选择隐藏。

隐藏列快捷键:ctrl + 0
隐藏行快捷键:ctrl + 9 取消隐藏行快捷键:ctrl +shift + 9

对于“工作地址”我们只想知道在哪个区即可,不需要知道具体的地址,因此做分列处理,提取原“工作地址”列的前六个字符即可。

15e0bd07cc2f676f75de0cb60ad74662.png
LEFT()、RIGHT()、MID() 的应用

选择列,筛选,发现异常值,修改后返回即完成,最后隐藏掉原“工作地址”列。

dbe19dff6ef9d62e18efc38fa1a2c863.png
下沙隶属于江干区

2.2 删除重复项

首先要找到重复值:,选择列,开始——条件格式——突出显示单元格规则——重复值

78c0cd39f71f16aac1c20c745e0e2f5a.png
注意:由于同一单位可能有多个不同类别的数据分析岗,因此不能对这样简单找到的数据进行删除

为了避免过度删除,决定将“招聘单位、薪资区间、招聘岗位、工作经验”合并为一个新的单元格,显示在N列上,然后对N列进行查找重复值。

7d3b1ad015627325217c7f7902c2604e.png
显然,合理多了
CONCATENATE()函数的应用

数据——删除重复项——取消全选——组合信息——确定

2.3 处理缺失值

excel中处理缺失值 主要对比各列的“计数”:

c2a054f42a3c53eab7c4aa6ab9ed52c2.png
A列计数123,C等其他列计数124,说明A列有1个记录缺失

快速定位缺失值:选择缺失的A列——开始——查找和选择——定位条件——空值:

8b5f65412fad4d16b88df3b2a3aa6023.png
缺少招聘单位,无法补全,故措施为:删除该记录
如何一次性补全多个缺失值:选中所有要补全的单元格,输入值,ctrl+enter

2.4 创建平均薪水

777636c7163a902a34626f33134af542.png
如何通过函数把一个薪资区间转化为最低/高和平均薪水
Find(要查找的字符串,字符串在单元格中的位置)
Left / Mid / Right()

debfff7bb4334358df8fe875a9b4f1bb.png
快速应用公式至整列:定位编辑公式了的单元格右下角,双击 光标。

数据——筛选——最低薪水列——找到错误原因:

cc68630797051b2af546b66f200e8640.png

0780b1c440c5956b69aacab065ec48d6.png
该记录中“薪资区间”为大写K,而不是小写k

改进:对K替换为k :选中该列,开始 ——查找与替换——K→k即可。

平均薪水创建时报错:

1f84c4d0576ceb9e4ad96ff73d38a7ee.png

97ea623d5ae5f0146c863892d5929b18.png
解决办法:复制这两列,选择性粘贴(选择“值”类型粘贴)
如何将文本格式的数字转化为数字格式:分列——分隔符不勾选

61f094c9b980bd076d08ad48168a0c19.png

2.5创建数据透视表【注意:数据分析表对整个sheet中数据进行分析】

077bcebf9c64058f7217f00de0c9a61e.png

点击:行标签——其他排序选项——降序排序(计数项:招聘岗位)。

b456387ca3ee832466667a9c9d37a2f2.png
在所有招聘岗位中,如果有不属于“数据分析岗”的职位,应该怎么操作才能清理掉这些不符的数据呢
清理不属于“数据分析”岗的职位: if-count-find 进行判断。
IF( COUNT(
FIND( {"数据分析","分析师"}, B2)
)
"Yes" , "No")

3、根据问题进行构建模型分析

问题一:杭州哪个区对于‘’数据分析“岗的需求比较大?

c22075717d52b6bb64e0322039b0a71d.png

分析可得:很显然,杭州西湖、余杭、滨江等区对“数据分析岗”的需求量较大,这与该些区域内分布着大量的互联网企业的事实相契合。

问题二:杭州’数据分析“岗对于工作经验的要求?

1566a3513262d9fa5225a98e90257472.png

分析可得:数据分析岗是个“年轻”的岗位,各招聘单位比较青睐拥有“1-5年工作经验”的人。

问题三:杭州“数据分析”岗位的薪水如何?

690f3b627086e3d4726807abf915e758.png
平均18k,中位数为17.5k,说明薪水还是具有较强的竞争力

5866fb122c4ab9d236832b755bc9f435.png
利用数据透视表,按区进行平均薪水比较

ba264872831447e7a644cc94e30321da.png
利用数据透视表,按工作经验进行平均薪水的比较

补充:创建一个名为“求职意向”的新excel文件,假定里面包含了你中意的单位名称,那么如何建立有效的连接,以便查询到每家单位的“薪资区间”呢?

a8e0735b46c88023925c821246659d5a.png
VLOOKUP()的应用

具体实现如下:

f00c016aae8b1ac23898aba772016a53.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值