聊一聊统计学和数据挖掘的区别(四)

13825820-1709d31f4cb0d448.jpg

前几篇文章中我们都是从统计学的角度给大家讲解数据挖掘和统计学的区别所在,但是对于统计学来说,数据挖掘中的核心就是准则,数据挖掘意味着数据集的规模,它常常标示着传统的准则不可用,我们在这篇文章中给大家详细地介绍一下这些内容。

相对于统计学而言,数据挖掘中准则起着更为核心的作用,数据挖掘所继承的学科如计算机科学及相关学科也是如此。数据集的规模常常意味着传统的统计学准则不适合数据挖掘问题,不得不重新设计。部分地,当数据点被逐一应用以更新估计量,适应性和连续性的准则常常是必须的。尽管一些统计学的准则已经得到发展,但更多的应用是机器学习。

在很多情况下,数据挖掘的本质是很偶然的发现非预期但很有价值的信息。这说明数据挖掘过程本质上是实验性的。这和确定性的分析是不同的。实际上,一个人是不能完全确定一个理论的,只能提供证据和不确定的证据。确定性分析着眼于最适合的模型建立一个推荐模型,这个模型也许不能很好的解释观测到的数据。很多,或许是大部分统计分析提出的是确定性的分析。然而,实验性的数据分析对于统计学并不是一个新生事务,或许这是统计学家应该考虑作为统计学的另一个基础,而这已经是数据挖掘的基础。所有这些都是正确的,但事实上,数据挖掘所遇到的数据集按统计标准来看都是巨大的。在这种情况下,如果使用统计工具可能会得出一个不准确的结果,这是因为百万个偶然因素可能就会使其失效。

而且,如果数据挖掘的主要目的是发现,那数据挖掘就不关心统计学领域中的在回答一个特定的问题之前,如何很好的搜集数据,例如实验设计和调查设计。数据挖掘本质上假想数据已经被搜集好,关注的只是如何发现其中的秘密。这些秘密往往就是数据分析工作中要找到的规律。

在这篇文章中我们给大家介绍了数据挖掘和统计学中的不同点,数据挖掘中的准则起着核心的作用,而统计学不是这样的。当然,数据挖掘的本质就是发现非预期但很有价值的信息,懂得了这些才能够发现数据挖掘工作的意义。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
统计学和数据结构在应用中有着密切的联系。统计学主要关注数据的收集、整理、分析和解释,而数据结构则是组织和存储数据的方式。下面是统计学和数据结构应用的一些例子: 1. 数据存储:在统计学中,我们需要存储和管理大量的数据。数据结构如数组、链表、树和图等可以帮助我们有效地组织和存储数据,以便进行后续的统计分析。 2. 数据检索:当我们需要从大量数据中检索特定的信息时,数据结构可以提供高效的检索方法。例如,使用哈希表可以快速查找特定值或者使用二叉搜索树可以快速查找有序数据。 3. 数据排序:在统计学中,我们经常需要对数据进行排序,以便更好地理解数据的分布和趋势。数据结构如堆、排序算法(如快速排序、归并排序)等可以帮助我们对数据进行排序。 4. 数据过滤和筛选:在统计学中,我们可能需要根据特定的条件对数据进行过滤和筛选。数据结构如栈、队列和链表等可以帮助我们实现这些操作。 5. 数据分析:统计学的目标是通过分析数据来揭示数据内在的规律。数据结构可以帮助我们对数据进行聚合、计算和统计,以便得出有意义的结论。 总之,统计学和数据结构在应用中相互依赖,数据结构提供了组织和处理数据的基础,而统计学则利用数据结构来进行数据分析和解释。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值