数据挖掘
文章平均质量分 72
虚言假面
no pain, no gain.
展开
-
Java实现K-Means聚类算法
K-means算法基本思想在数据集中根据一定策略选择K个点作为每个簇的初始中心,将数据划分到距离这K个点最近的簇中,共分成K个类。也就是说将数据划分成K个簇完成一次划分,但形成的新簇并不一定是最好的划分,因此生成的新簇中,重新计算每个簇的中心点,然后再重新进行划分,直到每次划分的结果保持不变。算法步骤随机选择K个中心点把每个数据点分配到离它最近的中心点(此处的距离采用欧氏距离)重新...原创 2020-03-13 19:09:40 · 3618 阅读 · 3 评论 -
Java实现K-Means算法
K-means算法基本思想在数据集中根据一定策略选择K个点作为每个簇的初始中心,将数据划分到距离这K个点最近的簇中,共分成K个类。也就是说将数据划分成K个簇完成一次划分,但形成的新簇并不一定是最好的划分,因此生成的新簇中,重新计算每个簇的中心点,然后再重新进行划分,直到每次划分的结果保持不变。算法步骤随机选择K个中心点把每个数据点分配到离它最近的中心点(此处的距离采用欧氏距离)重新计算...原创 2019-12-07 20:47:34 · 5021 阅读 · 1 评论 -
Java实现Apriori算法,挖掘关联规则
实现过程中参考了这位博主的方法,大家可以去看下这个算法的原理,在这里就不过多阐述。不过发现了一些小小的问题。原博主关联规则的计算貌似跟我学的不太一样,我的最小置信度计算如下。最小置信度计算如下:minconf(A→B) = minsup(AB) / minsup(A);在计算最小支持度时,最好不要存事务出现的概率,存取事务出现的次数为最佳;如果存概率的话,最好用事务出现的总次数除以事务数...转载 2019-07-12 13:26:21 · 3023 阅读 · 6 评论 -
Java实现朴素贝叶斯算法
算法原理朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。概率计算公式**P(A | BC) = P(A)P(B | A)P(C | A) / P(BC)对给定的一组特征进行分类本文的预测问题是“患者是否感冒”将以往...原创 2019-07-12 15:54:46 · 4173 阅读 · 2 评论