sql截取字段的部分数据_利用EXCLE做数据分析

第一步:明确问题,数据分析的目的是什么

第二步:理解数据,数据的可靠性,字段的意义等等

第三步:清洗数据,对脏数据进行清洗,清洗为我们想要的数据样式,方便后期的分析

第四步:数据分析过程或者构建模型

第五步:数据可视化,展示

第一步:明确问题,我们拿到的数据分析职位的招聘信息,

想知道数据分析的薪资水平,年限要求,教育要求等等

第二步:理解数据,即理解各个字段的意义,其中职位id是唯一id

第三步:清洗数据:

显示全部数据:全选所有数据,在开始的地方,选择自动换行

94ec93b7a961b845796b4363a03972e1.png

所有的数据就显示全了

excle中数据类型:

c952d9c42f59d23446f3627ec6f76e61.png

28058dac65ee6a665a2a4f00a5adbd8b.png

总的来说。分为字符串类型,数值类型,和逻辑类型

清洗过程:1,选择数据集合,(就是选择子集)

公司id,简称这俩字段用不着,不需要,为了不改变原有数据,可以对这俩列进行隐藏,

3d69c64c78da0c8766b17d42b3904a1d.png

选择隐藏的列,右键,点击隐藏

如果需要取消隐藏,

1ab4f5b424d86b0b3a2917876f6ed638.png

修改字段:双击字段就可以修改

删除重复项:

306f261140390d500a296267b3d3ffc9.png

选择按那个字段进行去重,在数据下选择删除重复项即可

e9d977f527bda9822c702b5903f90e46.png

查找缺失,选择id列,在右下角又显示数据条数,同样的方法可以查看任一列的条数

b7f22af1e3f8cad2f7a16d7c72590e66.png

1a31823e89082c9e4f378c203a4f3a36.png

城市这一列缺少了2条数据,找到缺失数据,处理缺失值

64c4abd90c403ec92043be7ba59bf2d2.png

在查找中选择定位条件,条件为空值

155f7e6c3a1f9bc9f1cdc4d28aa05832.png

d4dab216e78e49a14d41a1191b47dc68.png

在一个输入上海,按ctrl + enter 即空值位置都填充为了上海

一致化处理:就是将数据格式化为同样的格式,在公式所属领域中,有多个领域,需要拆分

be4714006b67b67294ba45a81e07aff3.png

选择这一列,在数据选项卡中,选择拆分,按分割符号拆分,

340cd81f4cbf34f664cf70797dcc7113.png

默认的分割符号中,选择其他,,将我们要拆分的分割符号输入

cc0353d29a786c6867a2cdb6bde6ac3a.png

EXCLE常用的函数:

平均值。everage

684d5067bfaa80f6c1aba706126ccd64.png

55ec1654c512f91dc102b23b6fb6d4ec.png

number1是第一个必须参数,选择需要求值的单元格,number2是可选参数,附加的值

f006971414c3ecdc67bc19d0f6b40864.png

在右下角变为+。双击之后将这个公式应用在这一列

find函数,find(要查找的字符串,字符串所在单元格位置),

用途:查找一个字符串在另一个字符串中出现的起始位置

常配合left,right,mid使用

24827bd122440d0407f5da1163e4b7ae.png

816a437ca0672ad7b2278397ef01b2ac.png

tleft:,right,mid用途:截取字符串

left(字符串所在单元格位置,从左边开始xx位置进行截取(位置))

7397898bccc18ad5aa6aa89bc5ad91c9.png

上面就出现了一个问题,如果num_chars是固定的,那就可能截取的是错误的,

这个时候配合find函数一起使用

dcfbd43534de44337e3db0d131b38219.png

通过find返回位置,配合left函数截取

截取最高薪水不能用right

db361d9cd9ee42511521f51b35398f70.png

应为find返回的是k在字符串中的第一个位置,不能倒数,

那就只能用mid了、

0e1f2bac680fb3f7a28349e0396bafef.png

将字符串转换为数值类型

6e122a68e7859803373912ce66ce1fb0.png

0293f3674257b434ba876b4b096066b7.png

d969ed1e7ea3c506e43937aa52638bc4.png

f9539ca2059265d376c3ce940cb8603f.png

数据排序:

数据透视表的原理:1.数据分组,2,应用函数,3,组合结果

e84b897e91471474aefb11bdad009443.png

新建一个数据透视表,选择要分组的行

5007297e3723c4f77e1789b9f6a840aa.png

对统计后的结果进行排序,选择按计数项进行排序

7a39bc61c1314b0ee744f55bc48c5865.png

我们需要的是数据分析这个职位的,选择我们需要的岗位

df17b97eb751d05a668cb797b31974bd.png

a8523d15bf64ba47f2b4dc5788266bce.png

选择我们需要的是的结果,保存

c48a73ebeab53b2059cd63e899951897.png

数据分析:主要是利用数据透视表来进行

练习:工作年限的不同,薪水师怎样变化的

dc28bf88450ce6014ea034e85b88875d.png

9af019325b7b76069aac6c62070fd16d.png

行选择工作年限要求,列选择平均薪水,由于默认值是求和,需要在球的值右键,选择统计的方式。即可,上面可知,工作年限越久,平均薪水越高

日期数据如何处理

a85f8205a3c9f153116104962e098f09.png

分列。按日期格式进行分列,可对大部分格式进行分列

814b6eec8cf6d278a1d3e4bad79e19fd.png

69e187e41a00f5c767213ea0785c9c7c.png

然后自定义日期格式。即可

如何按月统计,使用数据透视表来实现

6e0cfc2278c2965544be4c8fd6befde3.png

82c8c0a515771388794e6d473b4423e5.png

在日期列随便右键,选择组合,选择年月

91c80f701b2885e181cae5845510386a.png

当然也可选择季度

51dccc53228ead9e0e3480a7202f4520.png

如何按周进行统计

88fa5a9366b23c552fd302230be57d7b.png

在组合中,选择日,天数选择7天,起始日期设置为实际的起始日期

69e407ec18c77ff54415846cb1b63c61.png

如果不是求和项,可以设置最大值等等

vlookup的使用:一个表和另外一个表之间的连接查询,类似sql中的连接查询

语法:vlookup(找什么,在哪找,第几列,是准确找还是模糊找)

3dd2029eb0c286763f2ea6307bc52968.png

ec069289dabfea815ba040d681a9271a.png

由于是精确查找,找到第一个符合条件之后就直接返回,重复的值不会返回,那入股想要所有的都找到呢,综上可知,得将查找的内容设置为唯一的值,刚好id是唯一的。将内容和id合并后构建一个新的id来进行查找就可以了

三种引用:

相对引用A1,绝对引用$A$1。混合引用$A1 A$1

b07fbfcad92ed6d51cbfe49125148277.png

相对引用,默认。单元格会跟随变化变化

绝对引用

41c0c31e0f8a24948f6551ab473c82b5.png

单元格不会相对改变。固定一个单元格

混合引用

3df7483c3659fc2af08d1a5c523fba5a.png

有点难理解。还需深入理解

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值