数据分析必须想清楚的两个概念:指标和维度(转)

指标与维度是数据分析中最常用到的术语,它们是非常基础的,但是又很重要,经常有朋友没有搞清楚它们之间的关系,只有掌握理解了,我们的数据分析工作开展就就容易多了。现在就来说说指标与维度的那些事。

1、指标

指标,用于衡量事物发展程度的单位或方法,它还有个IT上常用的名字,也就是度量。例如:人口数、GDP、收入、用户数、利润率、留存率、覆盖率等。很多公司都有自己的KPI指标体系,就是通过几个关键指标来衡量公司业务运营情况的好坏。

指标需要经过加和、平均等汇总计算方式得到,并且是需要在一定的前提条件进行汇总计算,如时间、地点、范围,也就是我们常说的统计口径与范围。

指标可以分为绝对数指标和相对数指标,绝对数指标反映的是规模大小的指标,如人口数、GDP、收入、用户数,而相对数指标主要用来反映质量好坏的指标,如利润率、留存率、覆盖率等。我们分析一个事物发展程度就可以从数量跟质量两个角度入手分析,以全面衡量事物发展程度。

刚才说过,指标用于衡量事物发展程度,那这个程度是好还是坏,这就需要通过不同维度来对比,才能知道是好还是坏。

2、维度

维度:是事物或现象的某种特征,如性别、地区、时间等都是维度。其中时间是一种常用、特殊的维度,通过时间前后的对比,就可以知道事物的发展是好了还是坏了,如用户数环比上月增长10%、同比去年同期增长20%,这就是时间上的对比,也称为纵比;

另一个比较就是横比,如不同国家人口数、GDP的比较,不同省份收入、用户数的比较、不同公司、不同部门之间的比较,这些都是同级单位之间的比较,简称横比;

维度可以分为定性维度跟定量维度,也就是根据数据类型来划分,数据类型为字符型(文本型)数据,就是定性维度,如地区、性别都是定性维度;数据类型 为数值型数据的,就为定量维度,如收入、年龄、消费等,一般我们对定量维度需要做数值分组处理,也就是数值型数据离散化,这样做的目的是为了使规律更加明 显,因为分组越细,规律就越不明显,最后细到成最原始的流水数据,那就无规律可循。

最后强调一点,只有通过事物发展的数量、质量两大方面,从横比、纵比角度进行全方位的比较,我们才能够全面的了解事物发展的好坏。

进一步拓展思考,我理解为指标拆分和维度对比。

其实在实际产品数据分析的过程中也可参照以上思想。

通过大量的数据分析软件工具应用可以发现,主要包括以下内容:

  • 整体情况的分析和汇总:全局数据的概况、变化趋势、占比等
  • 多个维度的分析:如果是日志数据,已经存在多个数据项,以某一个数据项作为主关键词汇总分析,同比、环比变化,占总数的变化。如果没有日志数据,则需要想清楚解决这个问题原因是什么?需要采集哪些数据项?
  • 重要场景问题的分析:根据分析的重要问题、用户关心的问题进行分析
  • 软硬件性能管理、告警管理、报表管理、基础参数配置和用户管理等等

在多维度分析、告警、报表,数据图表可视化设计呈现方面也存在许多共性,总结如下:

  1. 数据的呈现方式是表格还是图表?若是时间范围,时间统计粒度是多少?
  2. 表格需要呈现哪些数据?数据的单位?保留几位小数?数据计算的方法?排序依据?
  3. 图表采用哪一种?呈现的范围是多少?
  4. 常见的数据项操作:新增、删除、修改、查询
  • 新增哪些是必填数据项?校验重复性和有效性?
  • 删除是否需要提醒?是否具有权限删除?
  • 修改可修改的数据项有哪些?修改后是否要进行校验有效性和重复项?是否有修改的权限?
  • 查询是精准查询还是模糊查询?是单一查询还是支持批量查询?批量查询输入方式的讲究?查询的内容输入什么是否支持大小写 空格等?数据区间的查询是自定义还是给出范围划分?

人们总认为与大数据分析沾点边的技术都要花大价钱才能得到。但事实上,大数据分析的思想才是最贵的,技术可以实现数据批量清洗,处理,呈现地更快、更美。但却不知道要哪些数据算有效,哪些数据才是重点需要分析得出有价值的信息。

见贤思齐焉,见不贤而内自省也。
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《数据质量管理:6个维度,50个检查项.pdf》是一份关于数据质量管理的指南文件,主要包括六个维度和五十个检查项。 这六个维度是指数据质量管理中需要注意的六个方面,包括:准确性、完整性、一致性、可靠性、及时性和可用性。 准确性是指数据的准确程度,即数据与实际情况的一致程度。在数据质量管理中,需要对数据进行准确性检查,确保数据的正确性和真实性。 完整性是指数据的完整程度,即数据是否包含所有必要的信息。在数据质量管理中,需要对数据进行完整性检查,确保数据不缺失、不重复,并且包含所有必要的字段和记录。 一致性是指数据在各个系统、模块或者时间点上的一致性。在数据质量管理中,需要对数据进行一致性检查,确保各个系统之间的数据一致性,保证数据的准确性和可靠性。 可靠性是指数据在各个操作中的可靠性和稳定性。在数据质量管理中,需要对数据进行可靠性检查,以确保数据能够在各种操作和环境下正常运行,并不会因为某些异常情况而导致数据失效或错误。 及时性是指数据的更新和发布的及时性。在数据质量管理中,需要对数据进行及时性检查,确保数据能够及时更新,并及时发布给相关人员和系统,以保证数据的实时性和有效性。 可用性是指数据对于用户和系统的可用性和易用性。在数据质量管理中,需要对数据的可用性进行检查,确保用户和系统能够方便地获取和使用数据,提高数据的价值和利用率。 《数据质量管理:6个维度,50个检查项.pdf》提供了五十个具体的检查项,针对以上六个维度进行细致的检查和评估。这些检查项可以根据实际情况进行筛选和应用,帮助企业或组织全面提升数据质量管理水平,确保数据的准确性、完整性、一致性、可靠性、及时性和可用性。 ### 回答2: 《数据质量管理:6个维度,50个检查项.pdf》是一份关于数据质量管理的文档。这份文档主要围绕数据质量管理展开,其中包括6个维度和50个检查项。 在数据质量管理中,涉及到的6个维度主要是:准确性、完整性、一致性、唯一性、时效性和可靠性。这些维度是评估数据质量的重要指标,帮助我们了解数据是否准确、完整、一致、唯一、及时和可靠。 而50个检查项则是针对以上6个维度的具体检查内容。这些检查项可以帮助我们评估和监测数据质量,并发现其中可能存在的问题和潜在风险。这些检查项包括但不限于:数据是否存在错误或异常值、数据是否缺失、数据是否符合标准格式、存在重复数据等等。 通过对这些检查项的实施,可以确保数据的质量得到有效的管理和控制。数据质量管理对于企业来说至关重要,因为高质量的数据能够提供准确可靠的信息支持,帮助企业做出决策和实施业务战略。 总之,《数据质量管理:6个维度,50个检查项.pdf》是一份针对数据质量管理的文档,通过6个维度和50个检查项来评估和监测数据质量,提高数据质量的管理和控制水平。 ### 回答3: 《数据质量管理:6个维度,50个检查项.pdf》是一份关于数据质量管理的文件,其中包含了六个维度和五十个检查项。 数据质量管理是指对数据的准确性、完整性、一致性、可靠性和及时性进行管理和控制的过程。这个文件把数据质量管理分为六个维度,即准确性、完整性、一致性、可靠性、及时性和可理解性。 首先,准确性是指数据的正确度和无误差性。在数据质量管理中,准确性是一个重要的指标,它确保数据的准确和可信度。本文件列举了一些检查项,用于评估和改善数据的准确性。 其次,完整性是指数据的完整性和完整性。它确保数据的完整性,没有缺失或丢失的值。文件中的检查项可以帮助评估和监控数据的完整性。 第三,一致性是指数据在不同系统和环境中的一致性。这是确保数据在各种应用程序和系统中的一致性非常重要的一个维度。文件中的检查项可以用来检查数据在这个方面的一致性。 第四,可靠性是指数据在长时间内保持不变的能力。在数据质量管理中,可靠性是一个重要的维度,因为它确保数据在时间和环境中的一致性。文件中的检查项可以帮助评估和监控数据的可靠性。 第五,及时性是指数据在所需的时间内可用的能力。在数据质量管理中,及时性是一个关键的因素,因为它确保数据在需要时及时可用。文件中的检查项可以用来检查数据的及时性。 最后,可理解性是指数据的易理解性和易使用性。数据质量管理中的可理解性是确保数据易于理解和使用的一个重要维度。文件中的检查项可以用来评估数据的可理解性。 总而言之,《数据质量管理:6个维度,50个检查项.pdf》提供了一个全面的数据质量管理框架,其中包含了六个重要的维度和五十个检查项,可以帮助组织评估和改善数据的质量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值