数据挖掘
pentiumCM
web前后端、深度学习;
展开
-
python(sklearn) 聚类性能度量
python(sklearn) 聚类性能度量一、sklearn聚类评价函数:metrics.adjusted_mutual_info_score(…[, …]) metrics.adjusted_rand_score(labels_true, …) metrics.calinski_harabasz_score(X, labels) metrics.davies_bouldin_sco...原创 2020-04-25 23:07:47 · 2495 阅读 · 3 评论 -
机器学习 — python(sklearn / scipy) 实现层次聚类,precomputed自定义距离矩阵
文章目录python 实现层次聚类1. scipy实现2. sklearn实现python 实现层次聚类关于层次聚类的原理,可以参考博客:https://blog.csdn.net/pentiumCM/article/details/105675576本博客主要讲解如何简单直接使用 python 来实现层次聚类。1. scipy实现linkage:def linkage(y, me...原创 2020-04-22 23:35:22 · 16689 阅读 · 4 评论 -
机器学习 - 聚类,聚类类别,聚类相似度,聚类性能度量
文章目录聚类一、概念二、聚类的类别1. 基于划分的聚类2. 基于层次的聚类3. 基于密度的聚类4. 基于网格的聚类5. 基于模型的聚类6. 基于模糊的聚类三、聚类的相似度度量参考资料聚类一、概念无监督学习:无监督学习(Unsupervised learning):训练样本的标记信息是未知的,目标是为了揭露训练样本的内在属性,结构和信息,为进一步的数据挖掘提供基础。监督学习:监...原创 2020-04-22 22:08:56 · 2639 阅读 · 0 评论 -
机器学习 — 主成分分析(PCA),python(sklearn)实现
文章目录主成分分析一、概念二、内容参考资料主成分分析一、概念主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过 正交变换 将一组可能存在相关性的变量转换为 一组 线性不相关 的变量,转换后的这组变量叫 主成分。二、内容基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的 综合指标 来代替...原创 2020-04-19 00:12:25 · 3583 阅读 · 2 评论 -
机器学习 — K-Means、K-Means++ 原理及算法实现
一、K-Means聚类1.概念:k-means algorithm算法:K-均值(K-Means)属于聚类算法,之所以称为K-均值是因为它把n个样本根据它们的属性分为k个簇(k < n),且每个簇的中心采用簇中所含值的均值计算而成。聚类:一种无监督的学习,事先不知道类别,自动将相似的对象归到同一簇中。聚类作为一种典型的数据挖掘方法,一直以来都是人工智能领域的一个研究热点,...原创 2019-12-22 21:57:01 · 6928 阅读 · 4 评论 -
数据挖掘 - 概述篇
数据挖掘学习笔记1.工具编程语言:python分为2.x 和3.x版本,我采用了3.x版本编程工具:Anaconda + PyCharmAnaconda提供了一些安装好的python库,PyCharm是python的开发IDE交互工具:jupyter notebookjupyter notebook配置参考:https://www.cnblogs.com/zlslch/p/698...原创 2019-12-19 20:26:00 · 763 阅读 · 0 评论