大数据分析技术有哪些类型

  数据分析技术使数据分析人员能够审查并回顾收集的数据,并根据信息进行推断或确定。大多数技术都侧重于应用定量技术来审查数据,一些比较常见的定量数据分析技术包括描述性统计、探索性数据分析和验证性数据分析。后两者涉及使用支持或不支持预定假设。使用这些技术的团体包括个人数据分析人员、学生、企业、政府机构和精算师,以及需要信息和数据的其他各个方面。

  定量数据分析:

  有时在尝试从收集的数据中消除数据分析人员的偏见。大量使用统计、概率或其他数学技术允许个人使用标准方法来解释数据。当数据分析人员试图使用定性数据分析技术时,一般基于个人的个人背景、偏好或基本研究和推理原则,收集的数据可能会被误读或错误解释。因此,数学技术不太容易受到这些错误的影响,而且往往更容易为其他个人或数据分析人员所接受。

  描述性统计分析:

  将数据分离或汇总成特定的组。如,人口统计学就是一组常见的描述性统计,数据分析人员将收集与人口年龄、性别、家庭规模、收入、工作类型和其他信息等相关的信息。另一种描述性统计分析,如,足球比赛中进行四分卫的完成百分比,如果四分卫在8次传球尝试中完成6次,他就有75%的成功率。这种技术的一个缺陷是统计数据无法提供额外的信息,比如每次传递的长度。

  探索性数据分析技术:

  通常使用箱形图、直方图、帕累托图、散点图或茎叶图,这项技术的主要目的是支持数据分析人员提出的假设。例如,数据分析人员可能想要证明一个关于驾驶特定类型汽车(如小型货车)的车主年龄范围的假设。为了验证和支持这一假设,数据分析人员将收集信息,并创建一个方框图,以确定在他规定的范围内的所有者数量。统计数据将提供支持或不支持假设的信息,并显示收集的数据中有多少异常值。

  验证性数据分析技术:

  是站在探索性技术的对立面。在这些测试中,数据分析人员可能希望推翻零假设,这是一个被大多数人普遍接受为正确的陈述。为了反驳原假设,研究者会收集与原假设相关的具体信息,并检验平均值、方差、p值和置信区间。由验证性数据分析所证明的置信区间将提供信息,说明数据分析人员对原假设是真还是假应该有多大的信心。

  大数据分析模型只是前人总结出的方式方法,对于我们实际工作中解决问题有引导作用,但是不可否认,具体问题还要具体分析,针对不同的情况需要进行不同的改进,希望成为一个数据专家,最重要的一点还是多实践!实践才是真理。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值