自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 分类算法可视化方法

可视化方法可以用于帮助理解分类算法的决策边界、性能和在不同数据集上的行为。下面列举几个常见的可视化方法。

2024-09-07 21:14:47 648

原创 分类评价指标

分类算法的评价指标用于衡量模型在分类任务中的表现,帮助判断模型的好坏和适用性。

2024-09-07 15:25:23 1211

原创 我的创作纪念日

回顾起初,我在创作博客时并没有设定明确的目标,只是想记录下日常学习中的点滴。每篇文章、每次分享,都是对自己的一个小挑战。通过写作,巩固了自己对知识的理解。这些点滴积累,最终成为了我持续创作的动力。创作规划:展望未来,我计划通过平台分享更多有深度的内容,希望能为更多读者带来帮助和启发。我相信,只要保持对学习和分享的热情,创作的道路会越来越宽广。

2024-09-01 23:22:36 300

原创 数据挖掘之分类算法

分类算法是数据挖掘中常用的一类算法,其主要任务是根据已知的训练数据(即带有标签的数据)构建模型,然后利用该模型对新的数据进行分类。分类算法广泛应用于金融、医疗、市场营销等领域,用于预测、决策支持等任务。

2024-08-29 23:08:54 1816

原创 论文阅读:scMGCA----模型方法

单细胞RNA测序提供了高通量的基因表达信息,使我们能够在单个细胞水平上探索细胞异质性。然而,在表征高通量基因表达数据时,面临着维度问题和掉落事件(dropout events)的挑战。为了解决这些问题,我们开发了一种用于单细胞数据分析的深度图学习方法—scMGCA。scMGCA基于图嵌入自编码器,能够同时学习细胞-细胞的拓扑结构表示和聚类分配。我们证明了scMGCA在细胞分离和批次效应校正方面具有高准确性和有效性,并在多个平台上超越了其他最先进的模型。

2024-08-20 23:14:22 1149

原创 论文阅读:scMGCA----结果分析及讨论

单细胞RNA测序提供了高通量的基因表达信息,使我们能够在单个细胞水平上探索细胞异质性。然而,在表征高通量基因表达数据时,面临着维度问题和掉落事件(dropout events)的挑战。为了解决这些问题,我们开发了一种用于单细胞数据分析的深度图学习方法—scMGCA。scMGCA基于图嵌入自编码器,能够同时学习细胞-细胞的拓扑结构表示和聚类分配。我们证明了scMGCA在细胞分离和批次效应校正方面具有高准确性和有效性,并在多个平台上超越了其他最先进的模型。

2024-08-18 17:22:31 904

原创 数据挖掘之数据预处理

数据预处理是数据挖掘中的一个关键步骤,它的主要目的是对原始数据进行清洗、转换和格式化,以确保其质量和一致性,从而为后续的数据挖掘任务(如分类、回归、聚类等)提供可靠的数据基础。

2024-08-18 10:50:34 596

原创 论文阅读:scCAN: Clustering With Adaptive Neighbor-Based Imputation Method for Single-Cell RNA-Seq Data

单细胞RNA测序(scRNA-seq)广泛用于研究不同样本中的细胞异质性。然而,由于技术上的不足,丢失事件常常导致基因表达矩阵中的基因表达值为零。本文提出了一种基于自适应邻域聚类的新插补方法,称为scCAN,用于估计丢失的零值。我们的方法通过同时学习相似性关系、聚类结构,并对相似性矩阵的拉普拉斯矩阵施加新的秩约束,持续更新细胞间相似性信息,从而改善丢失零值的插补效果。为了评估该方法的性能,作者使用了四个模拟数据和八个真实的scRNA-seq数据进行下游分析,包括细胞聚类、恢复的基因表达和重建的细胞轨迹。

2024-08-11 20:44:19 835

原创 数据挖掘之认识数据

认识数据,不仅要了解数据的属性、类型和量纲,还要了解数据的分布特性。只有充分认识了解要挖掘分析的数据,才能更好的检测数据的质量,助力于后续的挖掘工作。

2024-08-11 17:37:48 871

原创 数据挖掘可以挖掘什么类型的模式?

频繁模式(frequent pettern)是在数据中频繁出现的模式。频繁项集一般是指频繁的在事务数据集中一起出现的商品的集合。频繁出现的子序列,如顾客倾向于先买相机,再买内存卡这样的模式就是一个(频繁)序列模式。子结构可能涉及不同的机构模式,如图、数或格。如果一个子结构频繁出现,则可称为(频繁)结构模式。关联规则可分为单维关联规则和多维关联规则。

2024-08-02 18:11:42 558

原创 可以挖掘什么类型的数据?

2024-08-01 20:30:39 185

原创 什么是数据挖掘?为什么要进行数据挖掘?

我们写论文时很常用的一句开头语就时“随着信息时代的发展”,其实,也可以说我们是生活在“数据时代”。随着这种爆炸式的数据的增长,数据背后所隐藏的规律、知识也就亟需被人们所发现。数据挖掘可以表达为“从数据中挖掘知识”,或者“知识提取”,亦或是“数据/模式分析”等。4.数据变换(通过汇总或聚集操作,将数据变换和统一成适合挖掘的形式)。6.模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式)。7.知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。也有一些人把之称为“数据中的知识发现(KDD)”。

2024-07-28 22:56:52 224

原创 数据挖掘概念与技术

那什么是数据挖掘呢?为什么要进行数据挖掘呢?挖掘什么样的数据呢?等等众多问题随之产生。后续会针对数据挖掘概念与技术,参考机械工业出版社的《数据挖掘概念与技术》这本书进行系统的梳理和总结。在这个信息化的时代,数据的价值不言而喻。因此,数据挖掘变得十分的重要。

2024-07-15 23:07:36 119

原创 分数限制下,选好专业还是选好学校?

但有时候“鱼与熊掌不可兼得”,在分数受限的条件下,是选择一个心仪的专业还是选择一个知名度更高的学校?综上所述,在了解自身兴趣、职业规划和市场需求的基础上,选择一个既符合自己兴趣又具有发展前景的专业,将有助于你在未来的职业道路上取得更好的成就。通过参与专业相关的实践活动、竞赛和社团等,你可以锻炼自己的团队协作、沟通能力、创新思维等综合素质,为未来的职业发展打下坚实的基础。这些技能将成为你未来职业发展中的核心竞争力。选择自己热爱的专业,能够在学习过程中保持持久的热情和动力,更有可能在这一领域取得卓越的成就。

2024-06-30 22:45:59 289

原创 论文阅读:Simple and Efficient Heterogeneous Graph Neural Network

异构图神经网络(Heterogeneous graph neural networks, HGNNs)具有将异构图丰富的结构和语义信息嵌入到节点表示中的强大能力。现有的hgnn继承了许多专为同构图设计的图神经网络(gnn)的机制,特别是注意力机制和多层结构。这些机制带来了过高的复杂性,但很少有人研究它们对异构图是否真的有效。文中对这些机制进行了深入细致的研究,提出了简单高效的异构图神经网络(SeHGNN)。

2024-06-30 20:42:17 1302

原创 论文阅读:Beyond Discrete Selection: Continuous Embedding Space Optimization for Generative Feature Selec

摘要。

2024-06-18 15:55:18 970 1

原创 论文阅读:scHybridBERT

图学习模型在单细胞RNA测序(scRNA-seq)数据的计算分析中受到了越来越多的关注。与传统的深度神经网络相比,图神经网络和语言模型通过从原始基因计数矩阵中提取图结构数据表现出了更优越的性能。现有的基于深度神经网络的聚类方法通常侧重于时间表达模式,而忽略了基因层面和细胞层面的内在交互,这可以被视为单细胞数据中的空间动态。在多视图建模框架下,基因–基因和细胞–细胞的交互能够提高细胞类型检测的性能。在本研究中,提取了时空嵌入和细胞图,以捕捉分子层面的空间动态。

2024-05-29 23:50:35 1414

原创 阅读论文:scBERT as a large-scale pretrained deep language model for cell type annotation of scRNA data

基于单细胞RNA测序(scRNA-seq)数据对细胞类型进行注释是研究疾病进展和肿瘤微环境的前提。在此,我们展示了现有的注释方法通常存在缺乏精心整理的标记基因列表、处理批次效应不当以及难以利用潜在基因-基因交互信息的问题,削弱了这些方法的泛化性和鲁棒性。作者开发了一种基于预训练深度神经网络的模型,即单细胞双向编码表示转换器(scBERT),以克服这些挑战。遵循BERT的预训练和微调方法,scBERT通过在大量未标记的scRNA-seq数据上进行预训练,获得了对基因-基因交互的通用理解;

2024-05-28 15:01:30 1014

原创 信息系统项目管理师--八大绩效域-不确定性绩效域

信息系统项目管理师的八大绩效域包括:干系人、团队、开发方法和生命周期、规划、项目工作、交付、度量、不确定性。广义的不确定性包括:风险、模糊性、复杂性。

2024-05-24 21:03:24 290

原创 信息系统项目管理师--八大绩效域-度量绩效域

信息系统工程师的八大绩效域包括:干系人、团队、开发方法和生命周期、规划、项目工作、交付、度量、不确定性。度量绩效域涉及评估项目绩效和采取应对措施相关的活动和职能。

2024-05-24 20:37:10 313

原创 信息系统工程师--八大绩效域-交付绩效域

1、项目有助于实现业务目标和战略2、项目实现了预期成果3、在预定时间内实现了项目收益4、项目团队对需求有清晰的理解5、干系人接受项目可交付物和成果,并对其满意。

2024-05-24 20:05:25 198

原创 信息系统项目管理师--八大绩效域-项目工作绩效域

信息系统项目管理师的八大绩效域包括:干系人、团队、开发方法和生命周期、规划、项目工作、交付、不确定性、度量。项目工作绩效域涉及项目工作相关的活动和职能。

2024-05-24 19:25:29 267

原创 信息系统项目管理师--八大绩效域-规划绩效域

信息系统项目管理师的八大绩效域包括:干系人、团队、开发方法和生命周期、规划、测量、不确定性、项目方法、交付。规划绩效域涉及整个项目期间组织与协调相关的活动和职能,这些活动和职能是最终交付项目和成果所必须的。

2024-05-24 19:02:59 281

原创 信息系统项目管理师--八大绩效域-开发方法和生命周期绩效域

信息系统项目管理师的八大绩效域包括:干系人、团队、开发方法和生命周期、规划、项目方法、测量、不确定性、交付。

2024-05-23 14:10:07 252 1

原创 信息系统项目管理师--八大绩效域-团队绩效域

信息系统项目管理师的八大绩效域包括:干系人、团队、开发方法和生命周期、规划、项目工作、交付、测量、不确定性。团队绩效域涉及项目团队人员有关的活动和职能。

2024-05-23 09:59:23 270 1

原创 论文阅读:Denoising adaptive deep clustering with self-attention mechanism on single-cell sequencing data

大量研究已经展示了单细胞RNA测序(scRNA-seq)在研究单细胞层面的多样性和生物功能方面的应用。聚类识别未知细胞类型,对于scRNA-seq样本的下游分析至关重要。然而,scRNA-seq样本的高维度、高噪声和普遍存在的丢失率给样本的聚类分析带来了显著挑战。为此,作者提出了一种新的基于去噪自编码器和自注意力机制的自适应模糊聚类模型,称为scDASFK。该模型通过对比学习将细胞相似信息整合到聚类方法中,并使用深度去噪网络模块来去噪数据。

2024-05-23 00:43:57 1135

原创 信息系统项目管理师--八大项目绩效域-干系人绩效域

绩效域:8个与绩效密写相关的因素(干系人、团队、开发方法和生命周期、规划、项目工作、交付、测量、不确定性)。

2024-05-22 23:49:31 221 1

原创 信息系统项目管理师--十大知识领域之风险管理

信息系统项目管理师的十大知识领域包括整合管理、范围管理、成本管理、质量管理、进度管理、干系人管理、风险管理、沟通管理、资源管理和采购管理。

2024-05-22 23:20:30 168 1

原创 信息系统项目管理师--十大知识领域之采购管理

中的十大知识领域包含:整合管理、范围管理、质量管理、进度管理、成本管理、资源管理、干系人管理、采购管理、沟通管理和风险管理。本文要复习的是采购管理,与一样,我们从采购管理的过程,以及每个过程的输入、输出、工具与技术入手。

2024-05-19 23:23:59 424 1

原创 论文阅读:scAMAC: self-supervised clustering of scRNA-seq data based on adaptive multi-scale autoencoder

细胞聚类对于分析单细胞RNA测序(scRNA-seq)数据以理解高层次的生物学过程至关重要。基于深度学习的聚类方法近年来在scRNA-seq数据分析中被广泛应用。然而,现有的深度模型往往忽视了网络层之间的相互连接和交互,导致网络层内结构信息的丢失。为此,作者开发了一种基于自适应多尺度自动编码器的新型自监督聚类方法,称为scAMAC。自监督聚类网络利用多尺度注意力机制融合多尺度自动编码器的编码器、隐藏层和解码层的特征信息,这使得能够在同一尺度内探索细胞相关性,并捕捉跨不同尺度的深度特征。

2024-05-19 20:56:22 1217

原创 信息系统项目管理师--十大知识领域之整合管理

信息系统项目管理师》中的十大知识领域包含:整合管理、范围管理、进度管理、质量管理、成本管理、干系人管理、资源管理、沟通管理、风险管理以及采购管理。首先从信息系统的整合管理开始整理复习,主要从整合管理的过程,以及每个过程的输入、输出、工具与技术入手。

2024-05-19 00:27:47 495

原创 【论文阅读】:Effective multi-modal clustering method via skip aggregation network for scRNA-seq data

论文地址:https://academic.oup.com/bib/article/25/2/bbae102/7630472论文代码:https://github.com/DayuHuu/scEMC。

2024-05-17 17:28:14 936

原创 论文阅读:scGAC: a graph attentional architecture for clustering single-cell RNA-seq data

Yi Cheng, Xiuli Ma, scGAC: a graph attentional architecture for clustering single-cell RNA-seq data, Bioinformatics, Volume 38, Issue 8, March 2022, Pages 2187–2193, scGAC: a graph attentional architecture for clustering single-cell RNA-seq data | Bioinfor

2024-05-17 10:30:22 1499 1

原创 论文阅读:scTPC: a novel semi-supervised deep clustering model for scRNA-seq data

深度聚类层包含用于指导数据聚类过程的标签信息。然而,仅在聚类水平上提供的指导忽略了细胞之间的成对约束(Chen 等人,2021 年)。通常,定义了两种类型的约束:必须链接和不能链接(Basu 等人,2008 年)。Must-link 约束事先表示两个元属于同一类型,而 Cannot-link 约束事先表示两个相应的元属于不同的类型。成对的 Must-link 和 Cannot-link 约束通常用于半监督算法来引导聚类过程(van Engelen 和 Hoos 2020)。

2024-05-14 23:56:12 1411

原创 论文阅读:scBGEDA: deep single-cell clustering analysis via a dual denoising autoencoder

论文地址代码。

2024-05-13 23:14:10 1098 1

原创 论文阅读Deep Multi-Constraint Soft Clustering Analysis for scRNA-Seq Data via Zero-Inflated AE embedding

将细胞聚类成亚群在基于单细胞的分析中扮演着至关重要的角色,这有助于揭示细胞的异质性和多样性。由于单细胞RNA测序数据不断增加且RNA捕获率低,对高维稀疏的单细胞RNA测序数据进行聚类变得具有挑战性。在本研究中,提出了一种单细胞多约束深度软K均值聚类(scMCKC)框架。基于零膨胀负二项(ZINB)模型的自编码器,scMCKC通过考虑相似细胞之间的关联性,构建了一种新的细胞级紧密性约束,以强调簇之间的紧密性。此外,scMCKC利用由先验信息编码的成对约束来指导聚类。

2024-05-11 23:29:21 937 1

原创 论文阅读:A parameter-free deep embedded clustering method for single-cell RNA-seq data

单细胞核糖核酸(RNA)测序数据中的聚类分析被广泛用于发现细胞的异质性和状态。尽管已经开发了许多用于单细胞RNA测序分析的聚类方法,但大多数这些方法都需要提供聚类的数量。然而,事先知道细胞类型的确切数量并不容易,而且经验决定也不总是可靠的。本文开发了ADClust,一种用于单细胞RNA测序数据的自动深度嵌入聚类方法,可以在不需要预先定义聚类数量的情况下准确地对细胞进行聚类。具体而言,ADClust首先通过预训练的自编码器获得低维表示,并使用这些表示将细胞聚类成初始微聚类。

2024-05-10 13:28:20 1350

原创 论文阅读:scDFC: A deep fusion clustering method for single-cell RNA-seq data

聚类方法已被广泛应用于单细胞RNA测序数据以研究肿瘤的异质性。由于传统的聚类方法无法捕捉高维数据,近年来深度聚类方法因其在任务上的有希望的优势而越来越受到关注。然而,现有方法要么考虑每个细胞的属性信息,要么考虑不同细胞之间的结构信息。换句话说,它们无法同时充分利用所有这些信息。为此,本文提出了一种新颖的单细胞深度融合聚类模型,其中包含两个模块,即属性特征聚类模块和结构-注意特征聚类模块。更具体地说,构建了两个精心设计的自编码器来处理这两种特征,而不考虑它们的数据类型。

2024-05-09 13:25:24 849

原创 论文阅读:Deep structural clustering for single-cell RNA-seq data jointly through AE and GNN

单细胞RNA测序(scRNA-seq)可以研究细胞异质性和多样性的复杂机制。无监督聚类对于分析scRNA-seq数据至关重要,因为它可以用于识别潜在的细胞类型。然而,由于噪声影响、高维度和普遍的缺失事件,scRNA-seq数据的聚类分析仍然是一个计算挑战。本文提出了一种新的用于scRNA-seq数据的深度结构聚类方法,命名为scDSC,它将结构信息整合到单细胞的深度聚类中。所提出的scDSC包括基于零膨胀负二项式(ZINB)模型的自编码器,图神经网络(GNN)模块和相互监督模块。

2024-05-06 11:22:18 577 3

原创 论文阅读:Unsupervised Gene-Cell Collective Representation Learning with Optimal Transport (AAAI-24)

细胞类型识别在单细胞RNA测序(scRNA-seq)数据分析中起着至关重要的作用。尽管已经提出了许多用于聚类scRNA-seq数据的深度嵌入方法,但它们仍然未能揭示细胞和基因的内在特性。本文提出了一种新颖的端到端深度图聚类模型,scGCOT(single-cGene-COptimalTransport),它整合了细胞和基因的相关性。具体而言,scGCOT同时学习细胞和基因的潜在嵌入,并重建细胞图、基因图和基因表达计数矩阵。

2024-04-30 16:35:51 686

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除