生物信息
文章平均质量分 86
dundunmm
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【论文阅读】Semi-supervised deep matrix factorization model for clustering multi-omics data
本文提出SSD-MO模型,一种面向多组学数据的半监督深度非负矩阵分解方法。针对多组学数据高维、稀疏、噪声大的特点,该模型通过深度分解框架融合多视图信息,同时引入半监督机制、流形正则化和多样性约束,有效提升聚类性能。在TCGA六个多组学数据集上的实验表明,SSD-MO相比无监督方法F值提升9%-24%,较半监督方法提升7%-20%,聚类准确率达64%-73%,表现出优越的鲁棒性。该方法为多组学数据集成提供了有效框架,在基因组学研究和精准医学中具有应用潜力。原创 2025-12-22 07:00:00 · 1074 阅读 · 0 评论 -
【论文阅读】JojoSCL: Shrinkage Contrastive Learning forsingle-cell RNA sequence Clustering
本文提出了一种新颖的用于 scRNA-seq 聚类的自监督对比学习框架——JojoSCL。该方法引入了一种基于层次贝叶斯估计的收缩估计器(shrinkage estimator),通过将基因表达估计值向更加可靠的簇中心进行调整,以降低簇内离散度,并利用 Stein 无偏风险估计(Stein’s Unbiased Risk Estimate,SURE) 进行优化。借助这一机制,JojoSCL 同时提升了实例级和簇级对比学习的效果。原创 2025-12-20 17:05:06 · 1126 阅读 · 0 评论 -
【数据库】spatialLIBD
spatialLIBD是一个整合空间转录组数据分析和可视化的R/Bioconductor工具包,由Lieber脑科学研究所开发。该平台基于10x Genomics Visium技术,提供人类前额叶皮层六层结构的空间转录组数据,包含在线Shiny应用和本地R包两种分析方式,支持交互式探索基因表达的空间分布特征,并附带完整的研究论文和分析代码。原创 2025-12-19 23:28:25 · 253 阅读 · 0 评论 -
【论文阅读】Multi-modal Spatial Clustering for Spatial Transcriptomics Utilizing High-resolution Histology
本文提出stMMC模型,一种基于对比学习的多模态空间转录组聚类方法。该模型通过并行图自编码器融合基因表达数据与组织学图像特征,并利用对比学习机制优化特征表示。实验表明,stMMC在ARI和NMI指标上优于现有方法,验证了多模态融合的有效性。模型包含三个关键模块:多模态并行图自编码器、对比学习模块和聚类模块,能够有效捕获空间结构和细胞间相互作用。原创 2025-12-13 20:06:36 · 646 阅读 · 0 评论 -
【论文阅读】Multi-level multi-view network based on structuralcontrastive learning for scRNA-seq data clu
本文提出了一种基于结构一致性对比学习的多层次多视角网络(scMMN)方法用于单细胞RNA测序(scRNA-seq)数据聚类。该方法首先通过k近邻和扩散映射算法构建浅层视角,再利用图拉普拉斯滤波器生成深层视角,形成多层次多视角特征。通过引入组对比学习和结构一致性对比学习策略,增强模型对细胞特征和结构关系的判别能力。在特征融合阶段采用两步融合策略,最终通过k-means算法获得聚类结果。在8个真实scRNA-seq数据集上的实验表明,该方法显著优于现有先进方法,证明了其通过多层次多视角策略捕捉细胞复杂特征的能力原创 2025-10-30 23:13:04 · 1768 阅读 · 0 评论 -
【每天一个知识点】空间转录组学(Spatial Transcriptomics, ST)
空间转录组学是一种结合单细胞测序与空间定位的新技术,能在保留组织空间结构的同时获取全转录组数据。该技术突破了传统scRNA-seq丢失空间信息和免疫组化检测范围有限的局限,通过芯片捕获或原位测序等方法,实现"分子-细胞-组织"的立体映射。其在肿瘤微环境、神经科学和发育生物学等领域有重要应用价值。未来发展趋势包括与多组学技术融合、提升分辨率至单细胞水平,以及开发更先进的数据分析方法。该技术有望推动精准医学发展,为疾病诊断和治疗提供新视角。原创 2025-08-26 07:00:00 · 1670 阅读 · 0 评论 -
【论文阅读】MOSGAT: Uniting Specificity-Aware GATs and Cross Modal-Attention to Integrate Multi-Omics Data
本研究提出MOSGAT多组学数据融合框架,通过特异性感知图注意力网络(GATs)和跨模态注意力机制解决多组学整合的关键挑战。该框架为每种组学设计专用GAT提取特征,采用自适应置信注意力加权增强特征可靠性,并利用多头自注意力挖掘跨组学关联。在四个公开医学数据集上的实验表明,MOSGAT在分类性能上显著优于现有15种方法,验证了其在特征提取和跨组学关联探索方面的有效性。原创 2025-08-23 21:26:29 · 1436 阅读 · 4 评论 -
【每天一个知识点】 时空组学(Spatiotemporal Omics)
时空组学整合空间位置与时间动态,通过多组学技术(如空间转录组、蛋白组等)和计算方法(GNN、动态贝叶斯网络等),绘制生命系统的四维分子图谱。其应用涵盖发育生物学、肿瘤微环境、神经科学等领域,但面临高维数据融合、批次效应、算力需求等挑战。该技术为精准医学提供了新的研究视角。原创 2025-08-21 12:17:53 · 703 阅读 · 0 评论 -
【论文阅读】SIMBA: single-cell embedding along with features(3)
SIMBA提出了一种创新的单细胞图嵌入方法,通过构建细胞与特征(基因、ATAC峰等)的联合图结构,实现多组学数据整合与无聚类分析。该方法不仅能有效消除批次效应,还能在共享潜在空间中同步识别细胞类型特异性标记。相比传统方法,SIMBA在批次校正和多组学整合任务中表现优异,支持单细胞分辨率下的跨模态特征关联分析。其Python实现(https://simba-bio.readthedocs.io)为单细胞研究提供了统一框架,避免了碎片化分析流程,同时为未来新型单细胞数据的分析奠定了基础。原创 2025-08-21 07:15:00 · 1191 阅读 · 0 评论 -
【论文阅读】SIMBA: single-cell embedding along with features(2)
SIMBA是一种创新的图嵌入方法,能够将单细胞及其特征共同嵌入共享潜在空间。该方法通过构建细胞与特征(基因、染色质区域、DNA序列等)的关联图,实现多模态数据整合分析。实验表明,SIMBA在scRNA-seq分析中能准确分离细胞类型并将标记基因定位到相应细胞群附近;在scATAC-seq分析中可识别调控元件和转录因子结合位点;在多组学整合中能推断基因调控网络。相比现有方法,SIMBA提供了统一框架支持细胞异质性分析、标记物发现和调控推断,且不依赖聚类或特征选择。该工具已实现为Python库,为单细胞研究提供原创 2025-08-20 12:39:37 · 1504 阅读 · 0 评论 -
【每天一个知识点】主调控因子(Master Regulator)
摘要:主调控因子是位于基因调控网络顶层的核心转录因子,具有决定性调控作用(如Myod1、p53)。其特征包括层级控制、广泛下游效应和疾病相关性。在单细胞组学中,通过SCENIC等方法识别主调控因子,可揭示细胞命运决定机制和疾病治疗靶点。该概念为理解细胞分化和疾病发生提供了关键理论框架。原创 2025-08-20 11:35:36 · 360 阅读 · 0 评论 -
【论文阅读】SIMBA: single-cell embedding along with features(1)
摘要 SIMBA提出了一种创新的单细胞图嵌入方法,通过将细胞与多组学特征(基因、染色质区域、DNA序列等)共同嵌入共享潜在空间,克服了传统聚类依赖方法的局限性。该方法利用多关系图结构建模细胞-特征交互,支持无聚类标记物发现、基因调控推断、批次校正和多组学整合等任务。实验表明,SIMBA在scRNA-seq、scATAC-seq及多模态数据中的性能优于或匹配现有专用方法。其核心优势在于统一框架下的灵活图构建(如分箱编码表达值、跨批次边推断)和基于Softmax的特征对齐,最终生成的协同嵌入空间可直接支持生物学原创 2025-08-19 12:01:17 · 1496 阅读 · 0 评论 -
【每天一个知识点】OmicVerse
OmicVerse是一个基于Python的多组学分析框架,专注于RNA-seq数据处理(包括bulk、单细胞和空间转录组)。它整合了多样化的分析模块(如差异表达、细胞注释、轨迹分析等),提供统一的工作流程。创新性地引入BulkTrajBlend算法,通过β-VAE和图神经网络恢复scRNA-seq中遗漏的细胞类型。支持Python全流程操作,兼容Anndata数据结构,并可通过Conda/Pip便捷安装。其一体化设计简化了多组学分析,避免工具切换,提升研究效率。原创 2025-08-18 21:49:30 · 1116 阅读 · 0 评论 -
【论文阅读】Single-cell assignment using multiple-adversarial domain adaptation network with large-scale r
SELINA是一个基于大规模单细胞转录组参考图谱的自动化细胞类型注释框架。该研究整合了136个数据集、170万细胞和230种人类细胞类型,构建了全面统一的参考图谱。SELINA创新性地采用多重对抗域自适应网络消除批次效应,结合合成少数类过采样技术提高稀有细胞检测能力,并通过自编码器实现查询数据与参考数据的精准匹配。在17个组织95个数据集上的验证表明,SELINA在注释准确性上显著优于现有工具,尤其在疾病环境下表现出色。该框架提供Python和R软件包,为单细胞RNA测序数据分析提供了完整的注释解决方案。原创 2025-08-18 21:12:38 · 1389 阅读 · 0 评论 -
【每天一个知识点】单细胞RNA-seq数据注释综述
单细胞RNA测序数据注释方法研究进展 单细胞RNA测序技术革命性地推进了生物学研究,但海量数据的注释分析面临重大挑战。当前主流注释方法包括:基于标记基因的传统方法、聚类与差异分析、参考图谱比对以及新兴的机器学习方法。虽然这些方法在细胞类型鉴定方面取得进展,但仍需解决批次效应、注释标准不统一、稀有细胞识别、疾病样本注释等关键问题。未来发展趋势将聚焦于构建统一参考图谱、多模态数据融合、生成模型应用等领域,推动单细胞注释向标准化、智能化方向发展,为精准医学提供更强大的技术支持。原创 2025-08-17 23:35:07 · 1349 阅读 · 0 评论 -
【每天一个知识点】生物的数字孪生
摘要:生物数字孪生是通过数字技术构建与真实生物体高度一致的虚拟模型,实现"虚实映射+实时互动+数据驱动预测"。其核心特征包括三维结构精准再现、动态生理状态模拟以及实时数据更新。关键技术涵盖多模态数据融合、多尺度建模与AI预测分析,在精准医疗、药物研发等领域具有重要应用价值。当前面临数据完整性、模型泛化、计算资源等挑战,同时需解决生物伦理问题。该技术为生物医学研究提供了新的数字化研究范式。原创 2025-08-14 23:56:53 · 583 阅读 · 0 评论 -
【每天一个知识点】轨迹分析(Trajectory inference or Pseudotime analysis)
单细胞RNA测序中的轨迹分析是揭示细胞动态演化路径的关键方法,通过基因表达变化推断伪时间顺序,构建细胞状态转变轨迹。该方法广泛应用于发育、疾病进展和治疗应答等研究。主流工具包括Monocle3、Slingshot、PAGA等,支持不同分析需求。核心流程包含数据预处理、聚类、轨迹构建和可视化等步骤,通过伪时间和基因表达趋势图展示细胞演化路径。典型可视化采用UMAP背景图,标注起点、路径、分支和伪时间梯度来呈现细胞状态转变过程。原创 2025-08-09 07:00:00 · 1250 阅读 · 0 评论 -
【每天一个知识点】Marker基因鉴定(Marker gene identification)
单细胞RNA测序中Marker基因鉴定是识别细胞类型特异性基因的关键步骤,通过差异表达分析(如Wilcoxon检验、t检验等方法)筛选显著上调基因(log2FC>0.25,p_adj<0.05)。常用工具包括Seurat(R)和Scanpy(Python),流程涵盖基因筛选、排序及可视化。鉴定结果可用于细胞注释、功能富集分析和轨迹推断,为后续研究提供重要依据。原创 2025-08-08 07:00:00 · 1518 阅读 · 0 评论 -
【每天一个知识点】CITE-seq分析 与 scRNA-seq数据分析
CITE-seq与scRNA-seq数据分析对比 CITE-seq作为scRNA-seq的拓展技术,同时检测RNA和表面蛋白(ADT),形成多模态数据。相比单模态的scRNA-seq,CITE-seq在分析流程上需分别处理RNA和ADT数据,通过Seurat等工具实现双通道质控、归一化和降维。其核心优势在于结合蛋白表达提升细胞分型准确性,特别适用于免疫细胞亚群鉴定。分析工具如Seurat、TotalVI等支持多模态整合,使结果解读更精准。CITE-seq通过融合蛋白信息,有效解决了scRNA-seq中RNA原创 2025-08-06 07:00:00 · 1529 阅读 · 0 评论 -
【论文阅读】ACE: Explaining cluster from an adversarial perspective
本文提出了一种对抗聚类解释框架ACE,用于整合单细胞RNA测序分析中的三个关键步骤:降维、聚类和标记基因识别。传统方法独立执行这些步骤,忽略了非线性嵌入和基因间依赖关系。ACE通过神经网络化聚类过程,利用对抗扰动识别能够解释聚类差异的基因面板。该框架不仅能发现富集基因,还能识别在特定细胞类型中缺失的基因,以及区分相似细胞类型的差异基因。实验证明ACE可提取具有高区分性和低冗余性的基因集合,并可推广至图像识别等非生物领域。这一方法突破了传统标记基因的概念,为细胞群体分析提供了更全面的解释能力。原创 2025-08-04 23:19:49 · 1202 阅读 · 0 评论 -
【每天一个知识点】CITE-seq(Cellular Indexing of Transcriptomes and Epitopes by sequencing)技术
CITE-seq是一种整合单细胞转录组(scRNA-seq)和表面蛋白检测的多组学技术,通过抗体DNA条形码(ADT)实现同步分析。其核心流程包括:抗体标记、单细胞捕获、逆转录建库(mRNA和ADT双文库)及多模态数据分析。技术优势在于蛋白检测稳定性高,能补充RNA信号,显著提升免疫细胞分型精度。广泛应用于疾病模型、多组学整合及机器学习建模(如TotalVI)。相比REAP-seq、ECCITE-seq等技术,CITE-seq更成熟高通量,且可与ATAC-seq等组合。常用分析工具包括Seurat、scVI原创 2025-08-05 08:00:00 · 1188 阅读 · 0 评论 -
【论文阅读】Nonparametric clustering of RNA-sequencing data
摘要:本文提出一种非参数最大平滑似然(npMSL)算法用于RNA-seq数据的基因共表达聚类分析。该算法突破了传统参数模型对分布形式的限制,通过核密度估计和EM类算法实现无需预设分布类型的聚类。模拟实验表明,在正确设定簇数时,npMSL的灵敏度优于泊松模型和变换方法(但低于组合方法),特异性表现中等。当簇数设定错误时仍保持相对稳定的性能。在真实前列腺癌数据集中的应用显示,该方法能识别具有生物学意义的基因簇,且可能发现其他方法遗漏的聚类结构。研究为转录组数据分析提供了更灵活的混合建模方案。原创 2025-07-21 23:35:25 · 1374 阅读 · 0 评论 -
【论文阅读】Multi-view clustering for single-cell RNA-seq data based on graph fusion
《基于多视角图融合的单细胞RNA测序聚类算法scMCGF》 摘要:本文提出了一种新型单细胞RNA测序聚类算法scMCGF,通过多视角图融合方法解决scRNA-seq数据高维性和"掉零"现象带来的聚类挑战。该方法整合了基因表达、通路评分(PCA线性特征和扩散图非线性特征)四个视角,采用自适应学习优化各视角相似性图,并通过加权融合构建统一图矩阵。通过对拉普拉斯矩阵施加秩约束获得最终聚类结果。在13个真实数据集上的实验表明,scMCGF在聚类精度和鲁棒性方面优于8种现有方法,且生物学分析验证了原创 2025-07-03 07:30:00 · 1503 阅读 · 1 评论 -
【每天一个知识点】Protein–protein interaction (PPI)
摘要:蛋白质相互作用(PPI)网络通过节点(蛋白质)和边(相互作用)展示生物分子关系,在疾病机制、药物靶点发现和功能研究中具有重要价值。常用数据库包括STRING、BioGRID等,分析方法涵盖网络拓扑、社区发现和图深度学习。在单细胞转录组分析中,PPI网络构建流程包括:筛选差异基因、基因名转换、数据库查询及可视化。典型应用包括利用STRINGdb获取子网络,用于图神经网络建模和hub蛋白识别。该技术为系统生物学研究提供了关键工具。原创 2025-06-26 16:04:34 · 2284 阅读 · 0 评论 -
【论文阅读】scDCCA: deep contrastive clustering for single-cellRNA-seq data based on auto-encoder network
提出了一种新的深度对比聚类算法,称为scDCCA。该算法将去噪自编码器和双重对比学习模块集成进一个深度聚类框架中,以提取有价值的特征并实现细胞聚类。具体而言,为了更好地表征和稳健地学习数据表示,scDCCA采用基于去噪零膨胀负二项分布模型的自编码器来提取低维特征。同时,scDCCA引入了一个双重对比学习模块,用以捕捉细胞之间的成对相似性。通过增强正样本对之间的相似性、拉开负样本对之间的差异,实例级和聚类级的对比共同促进模型学习更具判别性的特征,从而实现更优的细胞区分能力。原创 2025-06-26 00:11:06 · 1242 阅读 · 0 评论 -
【每天一个知识点】CITE-seq 技术
CITE-seq技术整合单细胞转录组与表面蛋白表达分析,通过抗体-寡核苷酸偶联物标记细胞表面蛋白,与RNA同步测序。该技术利用微流控平台捕获单细胞,分别构建RNA和抗体条码(ADT)文库进行高通量测序,实现多模态数据整合。相比传统方法,CITE-seq具有多参数检测、样本量需求低、兼容现有平台等优势,在免疫研究、肿瘤微环境、发育生物学等领域应用广泛。数据分析需结合Seurat等工具进行双模态处理,通过蛋白标记提升细胞分群准确性。该技术为解析细胞异质性提供了新的多维研究手段。原创 2025-06-23 23:32:04 · 1678 阅读 · 0 评论 -
【论文阅读】scMDCL: A Deep Collaborative Contrastive Learning Framework forMatched Single-Cell Multiomics
摘要:本文提出scMDCL框架,一种基于深度协同对比学习的单细胞多组学聚类方法。针对现有方法忽略细胞间关系及组学特征交互的问题,scMDCL通过:(1)图自编码器提取细胞拓扑特征;(2)邻域信息传递增强特征表达;(3)对比学习强化跨组学特征对齐;(4)多组学协同聚类模块整合信息。在9个真实数据集上的实验表明,该方法在ARI、NMI等指标上显著优于10种主流方法,有效提升了多组学数据聚类性能。该框架为解析细胞异质性提供了新工具,代码已开源。原创 2025-06-23 21:40:24 · 1359 阅读 · 2 评论 -
【论文阅读】Multi-Class Cell Detection Using Spatial Context Representation
本文提出了一种新颖的细胞检测与分类方法MCSpatNet,首次通过多任务学习显式引入空间上下文信息。该方法采用Ripley的K函数从多类别、多尺度角度描述局部细胞密度分布,并通过深度聚类技术融合细胞形态特征与空间上下文。实验在乳腺癌、肺癌和结直肠癌三个数据集上验证,结果表明该方法在细胞分类任务上显著优于现有先进方法。主要创新点在于:1) 将空间统计函数引入细胞识别任务;2) 设计空间上下文预测模块;3) 提出深度聚类模块促进特征融合。该方法为数字病理学中的自动化诊断提供了新思路。原创 2025-06-14 08:22:42 · 1383 阅读 · 0 评论 -
【论文阅读】scSAMAC: saliency-adjusted masking induced attention contrastive learning for single-cell clus
本文提出了scSAMAC方法,用于改进单细胞RNA测序数据的聚类性能。该方法通过结合对比学习与负二项分布损失函数的变分自编码器框架,有效解决了单细胞数据高维度、稀疏性和噪声问题。scSAMAC的创新点包括:1)基于基因表达差异的显著性调整掩码模块,生成具有判别力的负样本;2)融合Wasserstein距离与软K均值的新型聚类损失函数;3)潜变量层的多头注意力机制,增强特征相关性学习。实验结果表明,该方法在聚类性能上优于现有技术。该研究为单细胞数据分析提供了更鲁棒且高效的解决方案。原创 2025-05-23 22:49:04 · 1534 阅读 · 0 评论 -
【生物信息】Gene Functional Module (GFM) Identification(基因功能模块识别)
Gene Functional Module(GFM)是由在生物功能上相关联的一组基因组成的集合,这些基因通常在同一信号通路、细胞过程或组织中共同表达或协同调控。GFM的识别流程包括输入基因集或表达矩阵、选择组织或条件背景、构建或利用基因互作网络、应用模块识别算法(如社区检测、聚类分析、图分解等),以及进行功能富集与注释。HumanBase平台提供在线模块识别服务,用户可以通过粘贴基因列表并选择组织来识别GFM,结果包括模块数量、基因组成、GO注释与交互网络等。GFM识别在单细胞聚类特征构建、疾病机制研究、原创 2025-05-22 10:30:00 · 838 阅读 · 0 评论 -
【无标题】从表达矩阵构建 GFM、扩展模块并做功能富集分析的 Python 流程
Tissue: Brain / Liver / Tissue-agnostic(任选)粘贴你提取的核心子图基因(如 core gene list)访问 “Gene Set Analysis” 页面。Interaction Graph(可视化)Gene Modules(功能模块)Enrichment(功能富集),如过多建议分批上传。原创 2025-05-23 07:30:00 · 742 阅读 · 0 评论 -
【每天一个知识点】HumanBase
HumanBase是一个由哈佛大学Broad Institute与Greene Lab等合作开发的公共数据库与分析平台,专注于识别和注释人类基因的组织特异性功能模块(Gene Functional Modules, GFM)。该平台整合了多组学数据、网络分析和机器学习技术,提供基因功能预测、网络可视化和功能富集分析等服务。HumanBase支持100多种人类组织和细胞类型,能够预测基因在不同组织中的功能角色,并识别与特定基因集合相关的功能模块。用户可以通过上传基因列表,获取显著的功能模块、功能富集结果和网络原创 2025-05-22 07:00:00 · 1111 阅读 · 0 评论 -
【论文阅读】scMUG: deep clustering analysis of single-cell RNA-seqdata on multiple gene functional modules
单细胞RNA测序(scRNA-seq)技术通过提供单个细胞层面的基因表达数据,极大地增强了对细胞异质性的理解。然而,scRNA-seq数据的稀疏性和高维度特征给分析带来了挑战。为此,我们提出了scMUG计算流程,该流程整合了基因功能模块信息,以提升scRNA-seq数据的聚类分析能力。scMUG流程包括数据预处理、细胞表示生成、细胞间相似矩阵构建及聚类分析,并引入了一种新的相似度度量方法,结合了局部密度与全局分布。通过对九个人类scRNA-seq数据集的评估,scMUG在揭示基因表达模式与细胞异质性之间的功原创 2025-05-21 22:27:32 · 1537 阅读 · 0 评论 -
【论文阅读】Towards multi-fusion graph neural network for single-cell RNA sequence clustering
本文提出了一种新的单细胞RNA测序(scRNA-seq)聚类方法——单细胞多融合图神经网络(scMFGNN),以解决现有方法在处理scRNA-seq数据时的两个主要局限:一是未能充分考虑节点属性与拓扑信息在可靠性上的差异,二是缺乏融合多尺度判别信息的能力。scMFGNN通过引入多融合图神经网络(MFGNN)和零膨胀负二项分布(ZINB)模块,动态融合多尺度表示,并自适应地整合节点表示与拓扑结构信息,从而提升聚类性能。实验结果表明,scMFGNN在多个scRNA-seq数据集上优于现有主流方法,验证了其在处理原创 2025-05-16 20:48:19 · 1387 阅读 · 0 评论 -
【论文阅读】Co-clustering of single-cell RNA-seq data based on weighted non-negative matrix tri-factoriza
如图1所示,提供了scCO₂的整体框架。将scRNA-seq数据集定义为 X∈Rn×s,即基因表达的计数矩阵。Xij 表示基因 i 在细胞 j 中的表达水平,且 X 中所有元素均为非负数。我们主要从R包 scRNAseq和收集了六个 scRNA-seq 数据集,列在表1中。原创 2025-04-27 17:42:05 · 1339 阅读 · 0 评论 -
【论文阅读】scASDC: Attention Enhanced Structural Deep Clustering for Single-cell RNA-seq Data
单细胞RNA测序(scRNA-seq)数据分析对于理解细胞异质性具有关键意义。然而,scRNA-seq数据固有的高稀疏性和复杂噪声模式对传统聚类方法提出了严峻挑战。为应对这些问题,我们提出了一种深度聚类方法——注意力增强的结构化深度嵌入图聚类(scASDC),该方法融合了多个先进模块,以提升聚类的准确性与鲁棒性。本文方法采用多层图卷积网络(GCN),以捕捉细胞之间的高阶结构关系,构成图自编码器模块。原创 2025-04-21 22:18:57 · 1616 阅读 · 0 评论 -
【论文阅读】Attention-based deep clustering method for scRNA-seq cell type identification
单细胞测序(scRNA-seq)技术相较于传统的整体RNA测序,能够以更高的分辨率揭示细胞间的差异性,从而揭示生物研究中的异质性。scRNA-seq数据集的分析依赖于细胞亚群的划分。当缺乏合适的参考信息(例如特定标记基因或单细胞参考图谱)时,无监督聚类方法成为主要选择。然而,scRNA-seq数据本身具有稀疏性和高维性的特点,这对传统聚类方法构成了挑战。因此,研究人员提出了多种基于深度学习的方法来应对这些挑战。由于现有方法大多只能部分改善效果,因此仍需一种更加全面的方法。原创 2025-04-09 17:39:57 · 1630 阅读 · 1 评论 -
【数据集】 PBMC(Peripheral Blood Mononuclear Cells)数据集
PBMC 数据集是:适合单细胞聚类、分类、多模态学习的标准测试集可用于图神经网络(scGCN、scTAG、scMGCA、scGCOT)等模型评估有多种公开来源和变种(RNA-only、RNA+ATAC、RNA+Protein)在 Python 中可通过 Scanpy 高效加载、预处理、可视化、构图。原创 2025-04-06 20:35:23 · 2325 阅读 · 0 评论 -
【数据集】人类细胞图谱(Human Cell Atlas, HCA)
人类细胞图谱(HCA)是一项全球性科学计划,旨在通过单细胞技术绘制人体所有细胞类型的综合参考图谱,从分子层面揭示健康与疾病的细胞基础。例如,在人类乳腺细胞图谱(HBCA)中,结合单细胞测序与空间蛋白组技术(PhenoCycler),解析了乳腺组织的细胞邻域和功能亚群。绘制了75种细胞状态,首次详细解析心脏传导系统细胞的分子特征及与神经胶质细胞的空间关系,为心律失常治疗提供新靶点。:结合单细胞测序与空间定位技术,揭示细胞间的物理接触与信号传递(如心脏传导系统细胞与神经胶质细胞的相互作用)。原创 2025-04-01 08:00:00 · 1707 阅读 · 0 评论 -
【论文阅读】scCAT: Single-cell Combined graph Attentional clustering for scRNA-seq analysis
单细胞RNA测序(scRNA-seq)的出现彻底改变了单细胞水平的基因表达研究,使得能够研究细胞异质性并识别稀有细胞群体。深度聚类对于分析scRNA-seq数据集至关重要,它通过将细胞划分为子群体。然而,基因表达中的固有稀疏性和变异性对聚类准确性提出了挑战。为了解决这些问题,本文提出了一种新的无监督深度聚类方法——单细胞组合图注意力聚类(scCAT)。该方法设计了一个双分支联合降维(JDR)模块来学习基因表达。该策略在捕捉复杂的非线性关系的同时,保留了关键的方差,有效应对了单细胞数据的高维挑战。原创 2025-03-14 19:12:46 · 1429 阅读 · 0 评论
分享