数据挖掘
hupc
这个作者很懒,什么都没留下…
展开
-
数据挖掘——决策树分类
决策树分类是数据挖掘中分类分析的一种算法。顾名思义,决策树是基于“树”结构来进行决策的,是人类在面临决策问题时一种很自然的处理机制。例如下图一个简单的判别买不买电脑的决策树:下图是一个测试数据集,我们以此数据集为例,来看下如何生成一棵决策树。决策树分类的主要任务是要确定各个类别的决策区域,或者说,确定不同类别之间的边界。在决策树分类模...原创 2019-11-11 23:05:00 · 1518 阅读 · 0 评论 -
数据挖掘--贝叶斯分类
贝叶斯分类器是一种基于统计的分类方法,用来预测诸如某个样本属于某个分类的概率有多大 它基于Bayes理论。贝叶斯分类方法基于一个推断或者说Bayes理论基于的一个前提:贝叶斯推断贝叶斯推断是一种统计学方法,用来估计统计量的某种性质。它是贝叶斯定理的应用。英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。贝叶斯公式:P(B|A) ...原创 2019-12-02 16:19:00 · 1758 阅读 · 0 评论 -
数据挖掘--K-means
K-Means方法是MacQueen1967年提出的。给定一个数据集合X和一个整数K(n),K-Means方法是将X分成K个聚类并使得在每个聚类中所有值与该聚类中心距离的总和最小。K-Means聚类方法分为以下几步:[1] 给K个cluster选择最初的中心点,称为K个Means。[2] 计算每个对象和每个中心点之间的距离。[3] 把每个对象分配给距它最近的中心点做属的clus...原创 2019-12-02 17:57:00 · 368 阅读 · 0 评论 -
数据挖掘--DBSCAN
DBSCAN:Density Based Spatial Clustering of Applications with NoiseBasic idea:If an object p is density connected to q, then p and q belong to the same clusterIf an object is not density conne...原创 2019-12-02 18:18:00 · 188 阅读 · 0 评论 -
数据挖掘--OPTICS
OPTICS是基于DBSCAN算法的缺陷提出来的一个算法。核心思想:为每个数据对象计算出一个顺序值(ordering)。这些值代表了数据对象的基于密度的族结构,位于同一个族的数据对象具有相近的顺序值。根据这些顺序值将全体数据对象用一个图示的方式排列出来,根据排列的结果就可以得到不同层次的族。考察DBSCAN,可以发现,对一个恒定的MinPts值来说,取值较小时得到的聚类结果完全包含...原创 2019-12-02 19:00:00 · 295 阅读 · 0 评论 -
数据挖掘--模型挖掘之聚类
聚类(Cluster analysis )定义:根据数据的特征找出数据间的相似性,将相似的数据分成一个类。作用:作为一个独立的工具对数据分布进行分析 可以作为其他算法(如分类等)的预处理步骤 Pattern Recognition Spatial Data Analysis Image Processing Economic Science (e...原创 2019-12-03 14:02:00 · 448 阅读 · 0 评论 -
数据挖掘--聚类算法对比
数据挖掘中几种聚类算法比较:cluster形状层次结构输入参数鲁棒性输入数据顺序敏感K-Means球形否k否否DBSCAN任意否ε,MinPts是否OPTICS任意可以多ε,MinPts是否BIRCH任意可以B(扇出因子)是是...原创 2019-12-03 16:20:00 · 230 阅读 · 0 评论