肥宅Sean

Never give up~

FCM算法实现Python(简洁版)

FCM算法 全名为Fuzzy C-Means,是一种聚类算法。 Fuzzy c-means (FCM) is a method of clustering which allows one piece of data to belong to two or more clusters. ...

2019-04-17 17:46:11

阅读数 514

评论数 0

PCA主成分分析以及Python实现(阅读笔记)

简述 PCA日常使用,但还没有研究过其理论,这让我很好奇。 理论部分 《机器学习》中是这样开始的: 对于正交属性空间的样本点,如何用一个超平面来对所有的样本点进行表达。 超平面和半空间是优化领域的两个重要概念 简单来说,矩阵方程W∗X+b=0W*X+b = 0W∗X+b=0表示的是超平面,W∗X...

2019-04-14 18:44:22

阅读数 172

评论数 0

DBSCAN算法理论和Python实现

DBSCAN算法 基于密度的聚类方法DBSCAN算法,是相当经典。 算法思路很简单。 简述算法思路: 选取密度较高的点作为核心点 通过一个核心点出发,把其领域的点都放入到广度优先搜索的队列中。 将所有找到的点归结为一个类。之后,再从新的没有被访问过的点中找其他的核心点开始,又继续进...

2019-04-06 09:45:04

阅读数 201

评论数 0

高斯混合模型GMM理论和Python实现

简述 高斯混合模型,就是说用多个高斯函数去描述不同的元素分布。 通过EM方法来迭代生成不同的高斯模型的各个参数。 具体的EM算法的理论网上很多,但推荐各位先看完这个算法思路之后,再去看理论推导就更加好了。 更新方法 μi′=∑j=1mηji∗xj∑j=1mηji\mu_i^{&...

2019-04-05 11:40:12

阅读数 225

评论数 0

KMeans++算法理论和实现

简述 在Kmeans当中,有两个限制 定义在凸欧式空间上,使得在非凸空间上的聚类效果一般,在非欧式空间上无法计算均值点。 病态初始化问题,由于初始化完全随机,会使得生成的点收到限制,最后聚类的结果不好 第一类问题的主流解决方案就是,转换距离度量的方式,这样能使得做到一定的扩展。但任...

2019-04-03 17:09:51

阅读数 146

评论数 0

【论文阅读】Clustering by Shift

Min Cut 含义很简单,就是将不属于同一类的所有点之间的相似度累加起来就好了。 是一种描述不同类之间 分离程度。 缺点:这个方法倾向于切割小的组出来。 这篇论文提出的想法之一: 进一步做一个变形。中间用到了一步,就是将属于同一类的就算部分补全,使得公式更加整洁。通过化简构...

2019-04-02 21:15:37

阅读数 89

评论数 0

提示
确定要删除当前文章?
取消 删除