GUI Research Group
机器学习, 生物信息
展开
-
机器学习理论及案例分析(part3)--聚类
聚类一直是机器学习、数据挖掘、模式识别等领域的重要组成内容。2015年,中国人工智能学会理书长李德毅院士指出:人类的认知科学要想有所突破,首先就要在人数据聚类上取得突破,聚类是挖掘大数据资产价值的第一步。...............原创 2021-03-11 20:44:19 · 1557 阅读 · 0 评论 -
单细胞文献学习(part6)--ForestFireClustering for sc sequencing combines iterative label propagation with ...
在单细胞测序的时代,越来越需要用聚类方法从数据中提取观点.在这里,我们介绍了ForestFireClustering,一种高效且可解释的方法,用于从单细胞数据中发现细胞类型.森林火灾聚类法使得minimalpriorassumptions,与目前的其他方法不同,它计算出每个细胞被分配到一个细胞类型标签的非参数化后验概率发现稀有细胞类型的有用工具....原创 2022-07-23 11:59:55 · 263 阅读 · 0 评论 -
文献记录(part109)--Self-Representation Based Unsupervised Exemplar Selection in a Union of Subspaces
从无标签的数据集中寻找一小部分代表是数据集总结和信息提取等广泛应用中的一个核心问题.经典的exemplar selection methods,如k-medoids,是在数据点接近几个聚类中心点的假设下工作的,而不能处理数据接近union of subspaces的情况.本文提出了一个新的exemplar selection model,该模型寻找一个子集,该子集以表示系数的l1l_1l1。...原创 2022-07-22 00:25:26 · 489 阅读 · 0 评论 -
文献记录(part107)--Detecting Meaningful Clusters From High-Dimensional Data ...
在高维聚类的背景下,特征加权的概念在过去几年中得到了相当大的重视,以掌握不同特征在揭示数据集聚类结构中的相对重要程度.然而,该领域流行的技术要么不能进行特征选择,要么没有保留Lloyd启发式解决k-means问题的简单性.在本文中,我们提出了LassoWeightedk-means(LW-k-means)算法,作为一种简单而高效的稀疏聚类,适用于特征数(p)可能远远高于观测数(n)的高维数据.LW-k-means方法施加了一个涉及特征权重的l1l_1l1正则化项,直接在稀疏聚类框架中。...原创 2022-07-17 11:56:05 · 354 阅读 · 0 评论 -
论文实验记录(part1)--Detection ofnatural clusters via S-DBSCAN a Self-tuning version of DBSCAN
学习笔记,仅供参考,有错必纠Journal:Knowledge-Based SystemsYear:2022Keywords:Clustering,Natural cluster,Distance,Density,NeighborsDetection ofnatural clusters via S-DBSCAN a Self-tuning version of DBSCANabstract基于密度的聚类算法对广泛的应用领域产生了巨大的影响. 随着数据种类和数量增多,其规模和各种内部组织不断上原创 2022-05-28 18:36:10 · 151 阅读 · 0 评论 -
文献学习(part98)--Pseudo-supervised Deep Subspace Clustering
学习笔记,仅供参考,有错必纠阅读状态:略读文章目录Pseudo-supervised Deep Subspace ClusteringAbstractINTRODUCTIONRELATED WORKDeep ClusteringPseudo-supervised LearningPROPOSED METHODBase ModelPseudo-Supervision ModulePseudo-label SupervisionThe Unified FormulationSUBSPACE CLUSTER原创 2022-05-26 22:41:53 · 417 阅读 · 0 评论 -
文献记录(part105)--Structured graph learning for clustering and semi-supervised classification
学习笔记,仅供参考,有错必纠阅读状态:略读Structured graph learning for clustering and semi-supervised classificationabstractGraphs have become increasingly popular in modeling structures and interactions in a wide variety of problems during the last decade. Graph-based c原创 2022-05-19 11:10:49 · 244 阅读 · 0 评论 -
文献学习(part96)--Subspace Clustering by Block Diagonal Representation
学习笔记,仅供参考,有错必纠期刊:TPAMI-2018作者:Canyi Lu; Jiashi Feng; Zhouchen Lin; Tao Mei; Shuicheng Yan文章目录Subspace Clustering by Block Diagonal RepresentationBackgroundthe short of prior workkey idea and algorithm overviewthe advantages of proposed algorithmpropose原创 2022-05-01 08:03:25 · 614 阅读 · 0 评论 -
文献学习(part95)--Constructing the L2-Graph for Robust Subspace Learning and Subspace Clustering
学习笔记,仅供参考,有错必纠期刊:文章目录Constructing the L2-Graph for Robust Subspace Learning and Subspace ClusteringBackgroundthe short of prior workkey idea and algorithm overviewthe advantages of proposed algorithmproposed algorithmCONSTRUCTING THE L2-GRAPH FOR ROBUST原创 2022-04-30 15:07:57 · 471 阅读 · 0 评论 -
文献记录(part103)--Fuzzy C-Means clustering for data with unequal cluster sizes and ... noise
学习笔记,仅供参考,有错必纠文章目录Fuzzy C-Means clustering algorithm for data with unequal cluster sizes and contaminated with noise and outliers: Review and development摘要IntroductionBrief review of the clustering algorithmsFuzzy C-Means (FCM) algorithmOutlier Removal原创 2022-04-29 21:13:44 · 349 阅读 · 0 评论 -
文献学习(part91)--Robust latent low rank representation for subspace clustering
学习笔记,仅供参考,有错必纠期刊:Neucom-2014作者:Hongyang Zhang; Zhouchen Lin; Chao Zhang; Junbin Gao文章目录Robust latent low rank representation for subspace clusteringBackgroundthe short of prior workkey idea and algorithm overviewthe advantages of proposed algorithmprop原创 2022-04-28 20:29:55 · 288 阅读 · 0 评论 -
文献学习(part93)--Smooth Representation Clustering
学习笔记,仅供参考,有错必究期刊:CVPR-2014作者:Han Hu; Zhouchen Lin; Jianjiang Feng; Jie Zhou文章目录Smooth Representation ClusteringBackgroundthe short of prior workkey idea and algorithm overviewthe advantages of proposed algorithmproposed algorithmEnforced Grouping Effec原创 2022-04-28 21:01:51 · 283 阅读 · 0 评论 -
文献学习(part92)--Robust Subspace Segmentation with Block-diagonal Prior
学习笔记,仅供参考,有错必纠期刊:CVPR-2014作者:Jiashi Feng; Zhouchen Lin; Huan Xu; Shuicheng Yan文章目录Robust Subspace Segmentation with Block-diagonal PriorBackgroundthe short of prior workkey idea and algorithm overviewthe advantages of proposed algorithmproposed algorit原创 2022-04-28 20:59:42 · 241 阅读 · 0 评论 -
文献学习(part94)--Robust Subspace Clustering via Thresholding Ridge Regression
学习笔记,仅供参考,有错必纠期刊:AAAI-2015作者:Xi Peng; Zhang Yi; Huajin Tang文章目录Robust Subspace Clustering via Thresholding Ridge RegressionBackgroundthe short of prior workkey idea and algorithm overviewthe advantages of proposed algorithmproposed algorithmThresholdin原创 2022-04-29 17:00:34 · 300 阅读 · 0 评论 -
聚类算法小记(part2)--谱聚类
学习笔记,仅供参考,有错必纠转载自:谱聚类(spectral clustering)原理总结文章目录谱聚类(spectral clustering)原理总结谱聚类概述谱聚类基础之一:无向权重图谱聚类基础之二:相似矩阵谱聚类基础之三:拉普拉斯矩阵谱聚类基础之四:无向图切图谱聚类之切图聚类RatioCut切图Ncut切图谱聚类算法流程谱聚类算法总结谱聚类(spectral clustering)原理总结谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法转载 2021-09-23 20:35:55 · 290 阅读 · 0 评论 -
聚类算法小记(part1)--基于密度峰快速搜索的聚类算法
学习笔记,仅供参考,有错必纠文章目录引言DPC算法概述例子缺点引言2014 年 6 月 Science 发表了自动确定类簇数和类簇中心的新聚类算法 DPC (clustering by fast search and find of density peaks),该算法能快速发现任意形状数据集的密度峰值点 ( 即类簇中心 ),并高效进行样本点分配和离群点剔除 , 适用于大规模数据的聚类分析 .DPC算法概述通过快速搜索和寻找密度峰(DPC)聚类,可以用简单的策略找到不同密度和形状的簇。DPC原创 2021-09-23 14:46:36 · 534 阅读 · 0 评论 -
聚类(part3)--高级聚类算法
学习笔记,仅供参考,有错必纠文章目录聚类方法高级聚类算法谱聚类高维数据聚类基于非负数矩阵分解的聚类不确定数据聚类聚类方法高级聚类算法谱聚类谱聚类使用数据相似矩阵而不是原始数据,利用邻接矩阵的特征向量可以确定数据集划分的性质工作。谱聚类通常包括3个步骤:利用所有的数据点构造相似图(相似度矩阵)将数据点嵌入一个图拉普拉斯特征向量更加容易发现簇的空间利用一个经典的算法(例如k-均值算法)对嵌入数据进行划分高维数据聚类维度诅咒轴平行子空间聚类任意方原创 2020-10-11 09:14:46 · 805 阅读 · 0 评论 -
聚类(part1)--聚类概述
学习笔记,仅供参考,有错必纠文章目录聚类概述聚类是无监督学习的主要任务聚类描述聚类概述聚类是无监督学习的主要任务聚类一直是机器学习、数据挖掘、模式识别等领域的重要组成内容。2015年,中国人工智能学会理书长李德毅院士指出:人类的认知科学要想有所突破,首先就要在人数据聚类上取得突破,聚类是挖掘大数据资产价值的第一步。和分类(监督学习的主要任务)不同,聚类是在无标记样本的条件下将数据分组,从而发现数据的天然结构,聚类在数据分析中扮演重要角色,它通常被用于以下三个方面:发现数据的潜在结构对原创 2020-10-10 22:30:13 · 638 阅读 · 0 评论 -
聚类(part4)--多源数据聚类算法
学习笔记,仅供参考,有错必纠文章目录聚类方法多源数据聚类算法多角度聚类多任务聚类多任务多视角聚类迁移聚类多模聚类聚类方法多源数据聚类算法多角度聚类很多时候个数据集的属性集可以划分成多个子集,每个子集可以较完整地反映数据的信息,即可以完成学习任务,这样的子集称为数据的一个视角,把所有视角都利用起来进行学习即多视角学习。典型的多视角聚类算法包括多视角谱聚类、基于NMF的多视角聚类等。多任务聚类很多学习任务是相互关联的,同时学习相关任务,并在任务之间传递信息,可以获得比任何一个单一任原创 2020-10-11 10:01:24 · 750 阅读 · 0 评论 -
聚类(part2)--经典聚类算法
学习笔记,仅供参考,有错必纠文章目录聚类方法方法图示经典聚类算法基于模型的算法基于划分的算法基于密度的算法基于网格的算法层次聚类算法聚类方法方法图示经典聚类算法基于模型的算法在概率模型中,其核心思想是将数据描述成一个概率生成过程。基于划分的算法基于划分的算法按某种目的将数据集划分成若干组,划分的的结果是使目标函数值最大化(或最小化).基于密度的算法聚类的一种解释是将被低密度区域分割开来的高密度区域识别出来,基于密度的算法实现这种解释,每个数据点的密度通常解原创 2020-10-10 22:56:30 · 283 阅读 · 1 评论