数据挖掘
文章平均质量分 73
夏荷影
这个作者很懒,什么都没留下…
展开
-
K临近算法检测异常操作(一)
概述K近邻(K-Nearest Neighbor,KNN)算法是机器学习领域使用最广 泛的算法之一,所谓KNN,就是K个最近的邻居的意思,说的是每个样 本都可以用它最接近的K个邻居来代表。KNN算法的核心思想是:如果 一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类 别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策时,只依据最邻近的一个或者 几个样本的类别来决定待分样本所属的类别。KNN方法在类别决策时, 只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近原创 2021-11-23 21:16:01 · 2064 阅读 · 0 评论 -
数据挖掘--数据挖掘基本概念
1.1 数据挖掘的定义本质概念:用最强大的硬件、最强大的编程系统和最高效的算法’来解决科学、商业、医疗健康、政府、人文以及众多人类努力探索的其他领域中的问题。1.1.1 建模对很多人而言’数据挖掘是从数据构建模型的过程’而该过程通常利用机器学习来实现。但是更一般地来说数据挖掘的目标是算法。当然,在很多重要的应用中,建模是难点所在。—旦模型建好,那么使用该模型的算法就直截了当了。1.1.2 统计建模目前,统计学家认为数据挖掘就是统计模型(statisticalmodel)的构建过程’而此处统计模型指原创 2021-10-10 15:57:54 · 1839 阅读 · 0 评论