sql 占比_SQL项目实战-数据分析职位分析

SQL的学习分为三个步骤:一是对基础知识的系统理解、整合和掌握,方法就是系统地看相关课程,并做思维导图笔记进行归纳整理;二是进行相应的实操作业练习,我是在sqlzoo网站完成了所有的操作练习;三是项目实战操作,所以我把自己实战的经过整理成了这篇文章。

业务是数据分析的核心目的,在进行数据分析之前,首先应该要明确分析目标。接下来要用MySQL对数据分析职位进行分析。

一、明确目标

1、数据分析在不同城市的职位数量

2、工作年限对薪酬的影响

3、数据分析职位的教育要求

4、数据分析的主要工作领域

5、数据分析的职位类型

二、数据导入

1、创建数据库

1fa0f3ca806eda35096dad3c3ad0bec6.png

2、创建表格

04a663a28acb32b52d90ed9e98f2b791.png

创建成功的数据表

3171b8711a85b74038a5692403f6a16f.png

然后导入文件,选择文件格式为CSV

151698a20415674a8bb3727b474a5037.png

中途出现了导入数据错误的情况

53cbd92f7c93b003e01c2adedc8e76a7.png

几经尝试发现是因为编码不对,用notepad进行了转码,数据就导入成功了。

三、数据清洗
1、统一为小写格式

a0b9cf7774210baa09edb3c707644570.png

2、去重

bd641492e0cf0fd8edbb97f82d0da1fb.png

3、删除salary中的dirty read

8447fe1a2fbe4588fa059dad624bc7fc.png

4、对薪资进行切分
首先插入最低薪资、最高薪资和平均薪资这三列。

bottomsalary = bots

topsalary = tops

averagesalary = aves

命令如下:

5650e8d60f7d29240a83f721431edc6d.png

看到表格里列添加成功

d6753dacdea87b66138156edcf6ec32d.png


然后对薪资这三列进行计算

9cdff6446722f10e03b03e16e9780b1c.png

计算成功

f4cc1a539347d7411483836fa08fdb0c.png

四、构建模型

1、数据分析职位在不同城市的职位数量和平均薪资

9db0cc4c573287c33b689b4e39739330.png

5e334f56a97f39deac6d920b4e9df26e.png

通过数据可以发现,数据分析职位在北、上、深、杭、广的需求明显高于其他城市,尤其是北京,占了所有岗位总和将近一半。其次是上海约占20%,然后是深圳约占10%,杭州约占8%,广州约占7%。再往后其他的城市占比明显降低。并且平均薪资也是北上深杭较高。

2、工作年限对薪资的影响

773350b673bda94b0ee0633a89f784f9.png

965c00144a7d592a7c3cd7778a330b6d.png

通过以上数据结果可以发现,1-3年和3-5年的需求是最大的,均在30%以上。相比较而言,10年以上的需求却很小,可能是因为数据分析是新兴的职位的原因。观察平均薪资可以发现,随着工作时间的增加,每月薪资涨幅在6-7k左右,说明职业发展较好。

3、数据分析职位对学历的要求

93f5c85e6e11c3f46c6110fbda30b9ea.png

d80a345bfb98b40bd6fd676edf33fa71.png

通过以上数据结果可以发现,本科学历所占比为76%,为数据分析的主力军,大专和硕士占比分别为12%和6%,博士学历所占最少。观察平均薪资可以发现,学历越高,平均薪资越高。

4、数据分析的主要工作领域

对数据工作领域的职位进行分类整理

2e4f39eba52bd9b364ba8c2c74c215d0.png

1533a23562ecdd5fb2eeefafbe65a361.png

通过数据可以发现,移动互联网、金融、O2O、数据服务和电子商务的职位数目较多,并且平均薪资在18k左右。

上面方式计算的职位数目是各领域不交叉,下面看一下在“移动互联网、金融、O2O、数据服务和电子商务”这些单独的标签下,岗位的数量情况。

a60d93f72648b395a4e1f5505e618c40.png

71a252b45984c4792bd24d8100be7b51.png

从该数据可以看到,移动互联网的职位数目最多。

下面可以继续分析不同城市的不同领域的职位数目。

c924f65d4b20d8c5ca85551076ad45fd.png

60f97165b2f4f36c6dbfbae1b0041c3d.png

通过数据可以发现,在各个城市当中,移动互联网的数量是最多的,然后是金融和数据服务。

总结:

在实战之前做好基础知识的框架建立,并做好相应的实操练习对项目的顺利进行帮助很大。由于之前通过学习网上教程,系统地学习了两本书《sql必知必会》、《SQL基础教程》并归纳整理了思维导图笔记,在sqlzoo里面扎实地完成了所有的实操练习,所以做起项目来相对来说还算顺利,但是也会遇到一些问题,比如开始导入数据的时候不成功,后来才发现是因为编码不对的原因。可见纵然知识体系掌握得再好也是需要经过不断的实际操作练习才能巩固和应用所学的知识。在数据分析这条路上,需要不断学习不断操作实际项目才能越走越远~

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值