mysql locate函数_数据分析实践——MySQL

3de64a62d3f3bdf45dd40507ae477b10.png

本次主要是用MySQL对数据分析相关岗位进行分析,相关数据来源于网上课程提供的数据。

1.数据理解

本次数据分为两个表格,company和dataanalyst,conmpany主要是关于公司相关信息的,dataanalyst主要是对岗位进行描述。

Company

ca8ae92183d0307483b661083a3cc367.png

Dataanlyst

9b7564e31c2463ff0bccab9160b8bb3f.png

用excel整理好数据表格,使用load data函数将数据导入MySQL数据库中,一边进行数据分析。

0278f0c2fc6228757d62dcca964fb7bc.png

2.提出问题:

(1)数据分析岗位在不同城市中的分布,以及薪资情况

(2)工作年限对于薪资的影响

(3)教育情况对薪资的影响

(4)不同行业对于数据分析的需求

3.数据清洗

(1)查询数据的数量

SELECT 

c3cb8524e41ab248eb233b6b6869c2c4.png
SELECT count(*) FROM data.dataanalyst;

a075cba5009b2a039622cc04d3d75afd.png

(2)拆分薪资salary列

首先执行命令set sql_safe_updates=0;放开增删改权限

set sql_safe_updates=0;

先新建最高薪资,最低薪资,和平均薪资3列

alter table data.dataanalyst add column bottom_salary varchar(50);
alter table data.dataanalyst add column top_salary varchar(50);
alter table data.dataanalyst add column avg_salary varchar(50);

拆分salary列,更新该部分数据

update data.dataanalyst SET bottom_salary = left(salary,locate('k',salary,1)-1);
update data.dataanalyst SET top_salary = substr(salary,locate('-',salary)+1,length(salary)-locate('-',salary)-1);
update data.dataanalyst SET avg_salary = (bottom_salary+top_salary)/2;

b12bfde94ef09d4b72f62269166b97d6.png

至此,数据清洗部分已经完成

4.数据分析

(1)数据分析岗位在不同城市中的分布,以及薪资情况

select city,count(positionId) as num,round(avg(avg_salary),2) as avg from data.dataanalyst
group by city order by num desc;

619015683ad0446dfe3fbbea9be17b8e.png
select city,count(positionId) as num,round(avg(avg_salary),2) as avg from data.dataanalyst
group by city order by avg desc;

9cd1df58cc996b98765a448f5843c176.png

可以看出,北上深在数据分析岗位需求量和薪资水平都是位居前三。

(2)工作年限对于薪资的影响

select workYear,COUNT(workYear),round(avg(avg_salary),2) as avg from data.dataanalyst
group by workYear order by avg desc;

dd317bc4464c62a91e2c6ff06fbc64d0.png

结果显示,薪资随工作年限的增长而长高;同时岗位要求工作年限在1-3年和3-5年最多。

(3)教育情况对薪资的影响

select education,COUNT(education),round(avg(avg_salary),2) as avg from data.dataanalyst
group by education order by avg desc;

f9ec47c5c04d91b356ec4aad231d49cd.png

结果显示,薪资随学历的升高而升高;同时,岗位要求本科学历的最多。

(4)不同行业对于数据分析的需求

select 
count(if(industryField like '%电子商务%',industryField,null)) as 电子商务,
count(if(industryField like '%互联网%',industryField,null)) as 互联网,
count(if(industryField like '%金融%',industryField,null)) as 金融,
count(if(industryField like '%O2O%',industryField,null)) as O2O,
count(if(industryField like '%数据服务%',industryField,null)) as 数据服务,
count(if(industryField like '%企业服务%',industryField,null)) as 企业服务,
count(if(industryField like '%生活服务%',industryField,null)) as 生活服务,
count(if(industryField like '%游戏%',industryField,null)) as 游戏,
count(if(industryField like '%教育%',industryField,null)) as 教育,
count(if(industryField like '%医疗%',industryField,null)) as 医疗,
count(if(industryField like '%旅游',industryField,null)) as 旅游,
count(if(industryField like '%广告%',industryField,null)) as 广告,
count(if(industryField like '%社交%',industryField,null)) as 社交,
count(if(industryField like '%信息安全%',industryField,null)) as 信息安全,
count(if(industryField like '%其他%',industryField,null)) as 其他
from data.dataanalyst;

8b24ef1956db1fd3e933d41308fdf9a8.png

可以看出,互联网,金融,数据服务和电子商务行业的数据分析岗位需求量最多。

5.结论

数据分析岗位在北上深等地区的需求量较大,且薪资较高;教育背景和工作年限对于薪资水平都有一定的影响;同时,由于行业特性,互联网,金融,数据服务和电子商务行业的数据分析岗位较多。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值