Excel进行数据分析

众所周知,excel是一个强大的办公软件。作为一个统计学专业的学生,一提到数据分析,大家所用的都是python、C、R等语言,却忘了很多基本的工作完全可以在excel里面用更简单的操作完成,尤其是那些对编程头痛的小伙伴,这是一种福音,当然这些可能只是数据分析师的初级工作。这篇文章是在听了知乎上猴子的live直播后自己整理的,希望能够进一步巩固自己的操作能力。

数据理解

1、试图的详细化
拿到一份数据,我们首先要观察行和列,看看都有哪些属性,如果想要全部看到每一列每一行的数据,就全选列表,然后进行自动换行操作,就会呈现下面的效果:

在这里插入图片描述
2、excel中的数据类型

在excel中如果字符串格式写出的数字是左对齐的,数值格式写出的数字是右对齐的。如下图所示:
在这里插入图片描述
3、数据的隐藏
如果想要隐藏某一列或者某一行,选中这一行(列),然后隐藏就好了。
如果想要显示全部的被隐藏行(列),全选数据然后在开始的格式选项里面选择取消隐藏行(列)
在这里插入图片描述

数据清洗

数据清洗的步骤一般有:选择子集、列名重命名、删除重复值、缺失值处理、一致化处理、数据排序、异常值处理。前两个非常简单,删除不要的列和重命名即可,下面只介绍其他的。
1、删除重复值
比如在职位ID这个属性中,有很多重复的职位,我们将它删除掉。选中这一列,在选项卡的数据标识下选择删除重复值就好了。
在这里插入图片描述
2、缺失值处理
处理缺失值的4种办法,根据情况灵活使用:

  • 人工补全

  • 删除缺失数据

  • 均值代替

  • 用统计模型计算
    点击每一列,下面会有这一列的计数,告诉你这一列共有多少个值。我们发现:职位ID这一列经过重复值删除后有5032列,而城市只有5030,我们将缺失的位置查找出来。(条件定位空值
    在这里插入图片描述
    通过公司简称,我们将地址全部填充为上海。(使用ctrl+enter即可)Ctrl+Enter快捷键,在不连续的单元格中同时输入同一个数据或公式时很好用。
    3、分列功能
    在这里插入图片描述
    需要注意的是:分列功能会覆盖掉右列单元格,所以我们记得先要复制这一列到最后一个空白列的地方,再进行分列操作。分割后效果如下:
    在这里插入图片描述
    4、函数的使用

  • AVERAGE(均值函数),这个函数非常熟悉,就不多介绍了,但是这个函数只能针对数值型的数据。

  • FIND(查找字符串所在单元格的位置)
    FIND(“要查找的字符串”,列位置)
    在这里插入图片描述

  • lEFT/RIGHT࿰

  • 5
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值