狭义的数据分析与数据挖掘。统计学,机器学习

一.数据分析:数据分析是指根据分析目的,用适当的统计分析方法及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用。

数据分析的过程可以大致分为:数据获取--数据清洗--数据处理--数据建模--分析结果呈现几个阶段。

1.数据获取:这个阶段的输出是一个数据子集(原始数据集的部分观察或者变量),困难之处在于理解相关的数据源

2.数据处理:对数据进行汇总,或者形式上的变换.编码的替换等。

3.数据建模:用于统计分析或机器学习算法对数据建模,以便描述数据或对未来进行预测。

4.分析结果呈现:把建模的结果以图.表或者更加复杂的可视化方式呈现出来。

数据挖掘:数据挖掘指的是在大型的数据库中对有价值的信息只是进行获取。具体的说,数据挖掘就是通过对海量的.杂乱无章的.不清晰的并且随机性很大的数据进行挖掘,找到其中蕴含的有规律并且有价值和能够理解应用的知识。数据挖掘的方法有两种:一种是分类分析,一种是聚类分析

分类分析:需要找到数据之间的依赖关系,并且进行预判输出离散类别。

聚类分析:先对数据进行初试归类,之后去粗取精进行合并,最后使得对象之间彼此联系归于一类。

区别与联系:数据分析更多采用统计学的知识,对源数据进行描述性和探索性分析,从结果中发现价值信息来评估和修正现状。而数据挖掘不仅仅用到统计学的知识,还要用到机器学习的知识,这里会涉及到模型的概念。数据挖掘具有更深的层次,来发现未知的规律和价值。

二.统计学:统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域。

   机器学习:机器学习是一门多学科交叉专业,对它的定义有以下三种

(1)机器学习是一门人工智能的科学,该领域的主要研究对象人工智能,特别是如何在经验学习中改善具体算法的性能。

(2)机器学习是对能通过经验自动改进的计算机算法的研究。

(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准

在大数据方面,机器学习对数据的转换,数据的处理数据的存储等带来了更好的技术支持,产业升级和新产业诞生形成了一种推动力量,让大数据能够针对可发现事物的程序进行自动规划,实现人类用户以计算机信息之间的协调。

区别与联系:统计学更多的是一种分析能力,建立在大量的数据中的一种推测方法,是一种数据研究,若无数据则无法处理,更多的是一种预测。而机器学习通常会牺牲可解释性以获得强大的预测能力,机器学习基于统计的框架,因为机器学习涉及数据,而数据必须基于统计学框架来进行描述。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值