![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
潘多拉星系
踏踏实实做事,认认真真做人
展开
-
数据挖掘——谱聚类(spectral clustering)基本原理及python实现
文章目录一、前言二、基本原理(一) 无向权重图1、 邻接矩阵 W2、 度 D(二)相似矩阵1、ϵ-邻近法2、K邻近法3、全连接法(三)、拉普拉斯矩阵(2) 拉普拉斯矩阵的性质(三) 无向图切图1、 子图与子图的连接权重2、 切图的目标函数(四) 谱聚类切图1、 RatioCut切图2、 Ncut切图三、谱聚类算法流程四、python实现五、谱聚类算法总结参考资料:一、前言 谱聚类(spect...原创 2019-12-26 11:04:33 · 16336 阅读 · 17 评论 -
数据挖掘——层次聚类(Hierarchical clustering)学习及python实现
文章目录一、前言2、自底向上的层次算法python实现层次聚类4、使用Sklearn中的层次聚类5、使用Scipy库中的层次聚类(1)linkage(y, method=’single’, metric=’euclidean’)(2).fcluster(Z, t, criterion=’inconsistent’, depth=2, R=None, monocrit=None)6、层次聚类的优缺点...原创 2019-12-24 18:01:07 · 14568 阅读 · 2 评论 -
数据挖掘——PAM(K-Medoids)聚类算法学习
文章目录一、前言二、算法描述三、实例描述算法四、python代码五、总结参考资料一、前言 k-means算法对离群点敏感,因为这种对象远离大多数数据,隐藏分配到一个簇时,它们可能严重地扭曲簇的均值。这不经意间影响了其他对象到簇的分配。 于是一种基于K-means的改进算法k-mediod应运而生。围绕中心点划分(Partitioning Around Medoids, PAM)算法是k-...原创 2019-12-23 16:43:14 · 25658 阅读 · 3 评论 -
TextRank算法学习及使用
文章目录一、算法思想二、python代码实现三、TextRank算法使用1、textrank4zh模块的安装2、实例介绍参考资料: 文本关键词抽取、文本摘要生成是自然语言处理(NLP)的应用之一,一定会对我们的生活产生巨大影响。随着数字媒体的发展和出版业的不断增长,谁还会有时间完整地浏览整篇文章、文档、书籍来决定它们是否有用呢?值得高兴的是,这项技术已经在这里了。也就是今天我们要学习的Tex...原创 2019-12-12 22:09:12 · 3416 阅读 · 1 评论 -
PageRank算法学习及使用
文章目录一、前言二、算法原理三、算法证明四、PR值计算方法1、幂迭代法2、特征值法3、代数法五、python代码(利用pygraph包实现)六、使用networkx库中的pagerank函数七、PageRank的缺点参考资料 在七年前读硕士时就听导师和其他的师兄在说用pagerank算法。。。。。,但是一直过没有真正的搞明白算法的真正原理。今天,就好好学习一下该算法。一、前言 这个要从搜...原创 2019-12-12 17:58:53 · 1787 阅读 · 0 评论 -
数据挖掘——AP聚类算法学习
文章目录一、算法简介二、算法模型1、相关概念(假如有数据点i和数据点j)2、数学公式三、算法流程_python代码四、sklearn中AP算法使用五、总结参考资料:一、算法简介 AP(Affinity Propagation)通常被翻译为近邻传播算法或者亲和力传播算法。是2007年的Science杂志上提出的一种新的聚类算法。AP算法的基本思想是将全部数据点都当作潜在的聚类中心(称为exem...原创 2019-12-10 22:10:18 · 5171 阅读 · 4 评论 -
数据挖掘——DBSCAN聚类学习及使用
文章目录一、基本思想1、原理2、参数选择3、算法的伪代码4、python代码实现二、DBSCAN算法可视化的迭代算法实现三、案例及使用1、采用datasets中的鸢尾花数据集2、采用大学生校园网的日志数据五、常用的评估方法:轮廓系数总结在现实生活中收集到的好多数据是没有标签的,要在上面做一些数据挖掘和分析的工作,首先能用到的就是通过聚类的方式来得到数据的类别。然后再去发现一些相关的知识。因此,近...原创 2019-12-09 11:46:20 · 1926 阅读 · 0 评论