cluster analysis - 聚类分析
density-based spatial clustering of applications with noise (DBSCAN,具有噪声的基于密度的聚类方法)
Yongqiang Cheng
既然选择了远方 便只顾风雨兼程 - 永强
展开
-
statistical classification - 统计分类
statistical classification - 统计分类统计分类是机器学习非常重要的一个组成部分,它的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。分类是监督学习的一个实例,根据已知训练集提供的样本,通过计算选择特征参数,创建判别函数以对样本进行的分类。与之相对的是无监督学习,例如聚类分析。...原创 2019-04-15 20:21:26 · 863 阅读 · 0 评论 -
Boosting
BoostingBoosting 是一族可将弱学习器提升为强学习器的算法。这族算法的工作机制类似:先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个基学习器;如此重复进行,直至基学习器数目达到事先指定的值 T, 最终将这 T 个基学习器进行加权结合。Boosting 族算法最著名的代表是 AdaBoost.References周志华 著. 机器学习[M]. 北京:清华大学出版社, 2原创 2018-01-01 00:06:54 · 443 阅读 · 0 评论 -
A Year in Computer Vision (计算机视觉这一年)
A Year in Computer Vision (计算机视觉这一年)A Year in Computer VisionThe M Tankhttp://www.themtank.org/A Year in Computer Visionhttp://www.themtank.org/a-year-in-computer-visionChinese version:机器之心翻译 2017-11-28 23:22:03 · 2093 阅读 · 0 评论 -
confusion matrix
confusion matrixhttps://scikit-learn.org/stable/modules/model_evaluation.htmlconfusion [kən'fjuːʒ(ə)n]:n. 混淆,混乱,困惑The confusion_matrix function evaluates classification accuracy by computing the confusion matrix with each row corresponding to the true原创 2019-07-06 18:31:01 · 2275 阅读 · 0 评论 -
支持向量机 - 引言
支持向量机 - 引言支持向量机是所有使用核学习方法中最好的机器学习算法。反向传播算法训练多层感知器,该算法的特点是其简单性,但是算法收敛速度慢且缺少最优化性。径向基函数网络另一类前馈网络,其主要思想来自于插值理论,然后描述了次最优的两阶段设计过程。我们将讨论另一种通用的前馈网络的类型,称为支持向量机 (support vector machines,SVMs)。从本质上来说,支持向量机是具有很多优秀性能的机器学习方法。要解释它是如何工作的,从模式分类中可分离模式的情况开始可能是最容易的。在此背.原创 2018-05-02 21:00:54 · 475 阅读 · 0 评论 -
Distance computations - Cosine distance - 余弦距离
Distance computations - Cosine distance - 余弦距离Distance computations (scipy.spatial.distance)https://docs.scipy.org/doc/scipy/reference/spatial.distance.htmlcomputation [kɒmpjʊ'teɪʃ(ə)n]:n. 估计,计算1. scipy.spatial.distance.cosinescipy.spatial.distance.c原创 2019-03-08 09:05:19 · 1180 阅读 · 0 评论 -
sklearn.metrics.confusion_matrix
sklearn.metrics.confusion_matrixhttps://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.htmlconfusion [kən'fjuːʒ(ə)n]:n. 混淆,混乱,困惑混淆矩阵是一个误差矩阵,用来可视化地评估监督学习算法的性能。混淆矩阵大小为 (n_classes, n_classes) 的方阵,其中 n_classes 表示类的数量。通过混淆矩阵,可以很容原创 2019-07-06 22:34:17 · 4445 阅读 · 0 评论 -
confusion matrix - terminology
confusion matrix - terminologyterminology [,tɜːmɪ'nɒlədʒɪ]:n. 术语,术语学,用辞condition positive (P)the number of real positive cases in the datacondition negative (N)the number of real negative cases in the datatrue positive (TP)eqv. with hittrue negati原创 2019-07-06 18:00:02 · 528 阅读 · 0 评论 -
分类 (classification) 与回归 (regression)
分类 (classification) 与回归 (regression)分类与回归本质上是一样的,都是对输入做出预测,都是监督学习。根据特征,分析输入的内容,判断类别或者预测数值。分类的目的是为了寻找决策边界,分类算法得到一个决策面,用于对数据集中的数据进行分类。回归的目的是为了寻找最优拟合,回归算法得到一个最优拟合线,可以最好的接近数据集中的各个点。分类问题输出的是物体所属的类别,回归问题输出的是物体的值。分类问题输出的值是离散的,回归问题输出的值是连续的。分类问题输出的值是定性的,回归问题输原创 2019-10-24 14:25:59 · 1445 阅读 · 0 评论 -
k-nearest neighbors algorithm - k 最近邻算法
kkk-nearest neighbors algorithm - kkk 最近邻算法In pattern recognition, the kkk-nearest neighbors algorithm (kkk-NN) is a non-parametric method used for classification and regression. In both cases, the input consists of the kkk closest training examples in th翻译 2019-04-11 22:02:01 · 2673 阅读 · 0 评论 -
DBSCAN 优化算法
DBSCAN 优化算法ComplexityDBSCAN is designed for use with databases that can accelerate region queries, e.g. using an R* tree.DBSCAN 被设计成能配合可加速 region query 的数据库结构,例如 R* 树。complexity [kəm'pleksətɪ]:n. 复杂,复杂性,复杂错综的事物database ['deɪtəbeɪs]:n. 数据库,资料库region [翻译 2019-04-11 18:52:49 · 3375 阅读 · 0 评论 -
第二章 预备知识
第二章 预备知识2.1 距离与中心点2.2 特征2.3 数据规范化ReferencesThe Minkowski distance is a metric in a normed vector space which can be considered as a generalization of both the Euclidean distance and the Manhattan distance.Minkowski distance:明可夫斯基距离,明氏距离,闵可夫斯基距离T转载 2019-02-15 22:35:17 · 422 阅读 · 0 评论 -
Curse of dimensionality - 维数灾难
Curse of dimensionality - 维数灾难curse [kɜːs]:n. 诅咒,咒骂 vt. 诅咒,咒骂 vi. 诅咒,咒骂dimensionality [dɪ,menʃə'nælətɪ]:n. 维度,幅员,广延The curse of dimensionality refers to various phenomena that arise when analyzing and organizing data in high-dimensional spaces (often w翻译 2019-03-04 20:54:08 · 3884 阅读 · 0 评论 -
第三章 直接聚类法
第三章 直接聚类法ReferencesReferences[4] A Tutorial on Clustering Algorithms. http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/[5] https://en.wikipedia.org/wiki/DBSCAN[6] 基于网格的高效 DBSCAN 算法[8] A Density-Based Algorithm for Discovering Clusters转载 2019-02-15 22:08:23 · 2008 阅读 · 0 评论 -
DBSCAN clustering algorithm - 密度聚类
DBSCAN clustering algorithm - 密度聚类转载 2020-11-14 16:09:15 · 938 阅读 · 0 评论 -
第一章 引言
第一章 引言cluster ['klʌstə]:n. 群,簇,丛,串 vi. 群聚,丛生 vt. 使聚集,聚集在某人的周围hierarchical [haɪə'rɑːkɪk(ə)l]:adj. 分层的,等级体系的balanced iterative reducing and clustering using hierarchies,BIRCH:利用层次方法的平衡迭代规约和聚类Clustering Using REpresentatives,CUREpartition [pɑː'tɪʃ(ə)转载 2019-02-15 19:56:05 · 488 阅读 · 0 评论 -
DBSCAN 聚类算法
DBSCAN 聚类算法DBSCAN 算法是一种基于密度的聚类算法,它能够发现任意形状的类别 (database 2),而 kkk-means 只能发现凸 (convex) 的形状 (database 1),同时 DBSCAN 还有很强的抗噪性 (database 3),在具有噪声的数据中发现任意形状的聚类。DBSCAN 只需扫描一遍数据集即可完成聚类,不需迭代执行。DBSCAN 是一种基于密度的聚类算法,密度聚类算法一般假定类别可以通过样本分布的紧密程度决定。同一类别的样本,他们之间是紧密相连的。在该翻译 2019-02-14 09:04:31 · 6719 阅读 · 0 评论 -
Implementing the DBSCAN clustering algorithm
Implementing the DBSCAN clustering algorithmGagarine Yaikhomhttps://github.com/gyaikhom/dbscanIn this note, we implement1 the DBSCAN clustering algorithm. DBSCAN stands for Density-based spatial clustering of applications with noise. This implementation翻译 2019-02-13 23:16:39 · 873 阅读 · 0 评论 -
The DBSCAN Clustering Algorithm
The DBSCAN Clustering AlgorithmGagarine Yaikhom/gyaikhom/dbscanhttps://github.com/gyaikhomhttps://github.com/gyaikhom/dbscanIn this project, we implement the DBSCAN clustering algorithm. For further details, please visit my homepage (implementing-the-d原创 2019-02-12 11:42:08 · 721 阅读 · 0 评论 -
第五章 DBSCAN
第五章 DBSCAN5.1 基本概念5.2 算法描述5.3 优缺点Referencesoddly ['ɒdlɪ]:adv. 古怪地,奇妙地,单数地References[4] A Tutorial on Clustering Algorithms. http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/[5] https://en.wikipedia.org/wiki/DBSCAN[6] 基于网格的高效 DB转载 2019-02-11 19:14:41 · 332 阅读 · 0 评论 -
DBSCAN clustering - Wikipedia
DBSCAN clustering - WikipediaDensity-based spatial clustering of applications with noise (DBSCAN) is a data clustering algorithm proposed by Martin Ester, Hans-Peter Kriegel, Jörg Sander and Xiaowei Xu in 1996. [1] It is a density-based clustering algorit原创 2019-02-11 12:34:16 · 1933 阅读 · 0 评论 -
DBSCAN 聚类算法与实例分析
DBSCAN 聚类算法与实例分析DBSCAN 聚类算法density-based spatial clustering of applications with noise (DBSCAN,具有噪声的基于密度的聚类方法)不需要预先指定 cluster 的个数。最终 cluster 的个数不确定。DBSCAN 聚类算法将数据点分为 3 类:核心点:在半径 Eps 内含有超过 MinPts 数目的点。边界点:在半径 Eps 内点的数量小于 MinPts,但是落在核心点的邻域内的点。噪音点:转载 2019-02-10 18:27:03 · 9327 阅读 · 1 评论 -
Demo of DBSCAN clustering algorithm
Demo of DBSCAN clustering algorithmFinds core samples of high density and expands clusters from them.Estimated number of clusters: 3Estimated number of noise points: 18Homogeneity: 0.953Completeness: 0.883V-measure: 0.917Adjusted Rand Index: 0.952原创 2019-02-10 11:25:32 · 725 阅读 · 1 评论 -
sklearn.cluster.DBSCAN
sklearn.cluster.DBSCANclass sklearn.cluster.DBSCAN(eps=0.5, min_samples=5, metric=’euclidean’, metric_params=None, algorithm=’auto’, leaf_size=30, p=None, n_jobs=None)Perform DBSCAN clustering from vector array or distance matrix.DBSCAN - Density-Based翻译 2019-02-09 22:27:39 · 3695 阅读 · 5 评论 -
scikit-learn - DBSCAN
scikit-learn - DBSCANThe DBSCAN algorithm views clusters as areas of high density separated by areas of low density. Due to this rather generic view, clusters found by DBSCAN can be any shape, as opposed to k-means which assumes that clusters are convex s翻译 2019-02-09 16:34:17 · 810 阅读 · 0 评论 -
scikit-learn - Clustering
scikit-learn - Clusteringscikit-learn - Machine Learning in Pythonhttps://scikit-learn.org/stable/scikit-learn - githubhttps://github.com/scikit-learn/scikit-learnClustering of unlabeled data can be performed with the module sklearn.cluster.Each clus翻译 2019-02-09 10:41:30 · 564 阅读 · 0 评论 -
density-based spatial clustering of applications with noise - 具有噪声的基于密度的聚类方法
density-based spatial clustering of applications with noise - 具有噪声的基于密度的聚类方法Density-based spatial clustering of applications with noise (DBSCAN) is a data clustering algorithm proposed by Martin Ester, Hans-Peter Kriegel, Jörg Sander and Xiaowei Xu in 199翻译 2019-01-30 09:59:27 · 949 阅读 · 0 评论