我对数据分析的初步理解

由于本人在本科期间就有《数据分析》这门课程。众所周知大学本科里的课程大部分学的都是理论知识,我还依稀记得里面有根据样本间的欧氏距离矩阵,应用最短距离方法进行谱系聚类分析还有主成分分析和回归分析等。再加之学校内部还有有关数据分析的实习。
因此毕业后打算从事数据分析的工作,但理想很美好,现实很残酷。我连什么样的数据才可以进行数据分析都不知道。根据纪贺元老师的《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中了解到不是所有的数据都可以做数据分析。在此就要引进可分析度这一概念。什么是数据的可分析度,纪贺元概括为两点,其一是数据必须是比较复杂的,一眼看不出结论的,需要使用一些工具、模型和方法进行分析;其二是数据分析的过程和结论 得是有价值的。因此引进三个维度来判断数据的可分析度,其分别是数据量、数据复杂度和数据颗粒度。数据量根本不用这一维度的必要性。数据量不大的数据没必要做数据分析,所需结论一眼就可以看出来。数据量相当于数据的行,其越多就越有数据分析的必要性。而数据复杂度相当于数据的列(剔除相关性之后的)。数据颗粒度指的是从不同的层次来看待数据。这股举例子说比较容易懂。其就像我们天气中日平均气温、月平均气温和年平均气温。年平均气温可以有十二个月的平均气温组合而成,以此类推。因此,我们说气温数据的颗粒度是:日、月和年。
通过数据分析我们可以了解数据的整体情况,其包括总体状况、结构状况、异常情况以及其他数据特征;可以快速查询数据;可以进行数据之间关系的探索(最像数据分析的部分);可以进行业务预测。待数据可分析后就得寻找合适的工具。然后将分析很好呈现出来。
数据分析的流程;首先得采集数据,然后整理数据、制表,之后再进行数据分析,最后把数据分析呈现出来。
这只是本人这只数据分析小白的初步读纪贺元老师的《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书所整理而得。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值