- 博客(1018)
- 收藏
- 关注
原创 数据分析:转录组差异分析方法总结(DESeq2+limma+edgeR+t-test/wilcox-test)
本文详细探讨了转录组数据分析中常用的差异分析R包(如DESeq2、limma和edgeR)及其与t-test/wilcox-rank-sum test的结合使用。文章首先介绍了如何下载和导入测试数据,并批量安装所需的R包。接着,讨论了基因表达count矩阵的标准化方法(如FPKM、TPM等),以及如何通过PCA、tSNE、UMAP和热图等方法进行基因整体水平分布的可视化。随后,文章分别展示了DESeq2、limma和edgeR的差异分析实现及结果解析,并探讨了结合t-test或wilcox-rank-sum
2023-07-17 11:01:18
25383
2
原创 【文献分享】OSDR基于空间截面的时态组织动态分析
生理和病理过程(如炎症和癌症)是由细胞间相互作用随时间演化而产生的。然而,由于组织活检只能提供单一时间点的"快照",传统方法难以追踪人体组织内细胞群体随时间的变化动态
2026-03-19 18:34:31
505
原创 【文献分享】利用 Evo 2 在生命的所有领域进行基因组建模与设计
Evo 2 能够准确预测基因变异(从非编码致病突变到具有临床意义的 BRCA1 变异)的功能影响,无需针对特定任务进行微调。机制可解释性分析表明,Evo 2 学习与生物学特征相关的表示,包括外显子-内含子边界、转录因子结合位点、蛋白质结构元素和噬菌体基因组区域。Evo 2 的生成能力能够在基因组层面生成线粒体、原核生物和真核生物的序列,其自然度和连贯性比以往的方法更高。Evo 2 还在预测模型3、4 的引导下以及在推理时间搜索的辅助下,能够生成经过实验证实的染色质可及性模式。我们已将 Evo 2 完全开放,
2026-03-19 18:28:28
358
原创 【数据分析】使用LSTM自编码器进行肠道微生物组时间序列异常检测的完整教程
严格的患者级别数据划分防止信息泄漏;基于临床指标构建可解释的代理标签;采用LSTM自编码器无监督学习正常菌群动态;通过验证集优化阈值确保泛化能力。最终模型在测试集上达到88.68%的ROC-AUC和99.6%的召回率,展现了出色的异常识别能力。
2026-03-14 13:26:47
126
原创 【文献分享】CeLLTra:通过基于通路的转换器将细胞名称与基因表达相匹配
单细胞 RNA 测序(scRNA-Seq)技术能够对单个细胞层面的基因表达进行详细探究,这对于标注细胞类型和理解细胞多样性至关重要。传统的细胞类型标注方法通常依赖于标志基因和人工标注,但由于数据质量低和参考数据集不完整等原因,存在诸多挑战。我们开发了 CeLLTra,这是一种新颖的对比学习框架,它利用基于 Transformer 的模型整合生物通路信息,将基因整合为超级标记,从而有效地从 scRNA-Seq 数据中捕获全面的基因表达。通过将这种基于通路信息的 Transformer 与预训练的特定领域语言
2026-03-03 08:55:53
607
原创 【数据分析】(荟萃分析三)“入侵外来物种对陆生昆虫生物多样性影响”--针对 “物种丰富度(Species richness)” 指标的元分析
## 总结1. **核心目标**:量化入侵物种对陆生昆虫丰度和物种丰富度的影响效应,识别调节该效应的关键因素(如昆虫目、入侵物种类型),并验证结果的稳健性;2. **技术逻辑**:遵循 “数据清洗→核心指标分析→补充指标验证→敏感性检验” 的元分析标准流程,适配生态数据的多层非独立性特点,采用改进的统计方法(如多层 Egger 回归)保证分析的科学性;3. **研究价值**:从丰度和丰富度两个维度全面回答 “入侵物种如何影响昆虫生物多样性”,为入侵生物学的理论研究和实践防控提供量化证据。
2026-03-03 00:15:00
148
原创 【数据分析】(荟萃分析二)“入侵外来物种对陆生昆虫生物多样性影响”--针对 “丰度(Abundance)” 指标的核心元分析
1. 核心目标:量化入侵物种对昆虫丰度的整体影响效应,并明确昆虫目、入侵物种类型、地理环境(岛屿 / 大陆)、飞行能力等因素是否调节该效应;2. 关键价值:通过严格的统计校正(小样本偏差、发表偏倚、非独立性)和多维度敏感性分析,保证元分析结果的可靠性和稳健性;3. 最终产出:入侵物种对昆虫丰度影响的核心效应值、各调节因素的作用方向 / 显著性、一系列符合学术规范的可视化图表,以及验证结果稳健性的敏感性分析证据。
2026-03-02 19:31:10
235
原创 【数据分析】(荟萃分析一)“入侵外来物种对陆生昆虫生物多样性影响” --数据清洗与探索性分析
1. 核心目标:将原始非标准化数据整理为统一、规范的格式,消除数据不一致性(如误差类型、分类标签),为元分析模型提供高质量输入数据;2. 关键价值:通过探索性分析和可视化,全面展现数据的时间、地理、分类、数值特征,帮助理解数据集的结构和分布特点,为后续元分析的模型选择、分组策略提供依据;3. 最终产出:一份可直接用于元分析的清洗后数据集,以及一系列展现数据特征的可视化图表,支撑后续的元分析结论解读。
2026-03-02 19:15:18
107
原创 【数据分析】讲义:线性混合模型 LMM(重复测量的中心–病人数据)
1. 识别哪些临床数据需要 LMM(重复测量、中心-病人分层、相关性)2. 写出并理解 LMM 公式:固定效应 vs 随机效应3. 会建:随机截距模型、随机斜率模型、中心/病人嵌套模型4. 会解释输出:固定效应系数、随机效应方差、ICC、个体差异5. 会比较模型:AIC、LRT(似然比检验)、REML/ML 的使用规则6. 能做基本诊断与预测:残差、随机效应、边际均值、个体预测
2026-03-01 00:30:00
370
原创 【数据分析】python历史与未来云量变化驱动的生产力效应
**技术亮点**包括:xesmf重网格化实现多分辨率数据融合,纬度余弦加权确保全球平均的物理严谨性,以及双时间轴布局(前三图1984-2025年、底图1984-2100年)的巧妙设计。代码的模块化结构(敏感性计算、多源读取、归因分析、可视化)便于扩展至其他驱动因子(如温度、CO₂)的类似归因研究。**应用价值**在于为IPCC评估报告提供云-碳反馈的观测约束,特别是当前地球系统模型对云量变化生态效应模拟存在显著不确定性的背景下。结果可为生态系统管理(如干旱区绿化潜力评估)和气候政策(如碳汇稳定性考量)提
2026-03-01 00:15:00
190
原创 【数据分析】python年际云量变化对植被生产力的影响
**技术亮点**包括:年际差分法有效分离长期趋势,邻域回归平衡空间分辨率与统计稳健性,以及跨尺度一致性分类图的创新可视化。代码的模块化结构(数据读取、邻域回归、尺度对比、可视化)便于扩展至其他环境因子(如温度、CO₂)的跨尺度研究。**应用价值**在于为地球系统模型(ESMs)评估提供基准:当前模型常基于瞬时响应参数化云-碳耦合,若季节与年际响应确实存在系统性差异,则模型需引入记忆效应或适应机制的参数化改进。结果对预测云量变化(如增云增雨趋势)的生态系统后果具有直接政策相关性。
2026-02-28 13:44:35
81
原创 【数据分析】python云量敏感性机制:降水与光照效应的权衡
使用statsmodels进行专业统计诊断,sklearn实现高效机器学习回归,以及LaTeX格式标签的专业制图。代码的模块化设计(数据读取、机制计算、统计建模、可视化分离)便于迁移至其他生态系统响应研究。结果可为CMIP6等全球气候模型改进云-碳反馈参数化提供关键观测证据,特别是在当前模型普遍低估云量变化生态效应的背景下具有重要应用价值。
2026-02-28 13:41:18
199
原创 【文献分享】scHiCAR利用 scHiCAR 技术对复杂组织中的转录组、表观基因组和三维基因组进行三模态单细胞分析
顺式调控元件(CREs)的三维(3D)组织在转录控制中至关重要。然而,从同一单细胞中捕获转录组、表观基因组和 3D 基因组仍然具有挑战性。在此,我们介绍了 scHiCAR(单细胞 Hi-C 与转座酶可及染色质和 RNA 测序的组合),这是一种基于平板的组合条形码方法,可同时从同一细胞中对 mRNA、开放染色质和染色体构象捕获进行分析。与现有的单细胞 3D 基因组方法相比,scHiCAR 更有效地富集了锚定在候选 CREs(cCREs)上的长程顺式相互作用。将其应用于 162 万个小鼠脑细胞,并结合基于深度学
2026-02-27 20:45:49
737
原创 【数据分析】python探究云量变化对植被生产力的影响
本代码实现了一套完整的云量-生产力敏感性分析流程,核心贡献在于揭示了云量变化对植被生产力的影响随气候干旱度呈现系统性转变的科学规律。主要结论体现在三个方面:第一,方法学创新。 代码构建了从站点观测到全球模拟的多尺度验证框架,通过标准化处理消除量纲差异,使地面通量塔观测与遥感模型结果具有可比性。密度估计函数的引入解决了海量格点数据可视化的重叠问题,显著提升了全球格局图的判读性。第二,生态学发现。 图形输出预期将显示:在干旱区(AI<1),云量增加可能通过降低辐射胁迫和蒸散发损耗而促进GPP(正敏感性);在
2026-02-27 10:18:46
37
原创 【科研绘图系列】R语言绘制图系统发育树结合的基因表达图
本文介绍的可视化方法体现了现代计算生物学的核心原则:将数据、算法和可视化紧密结合,以产生有意义的生物学洞见。通过将系统发育树与定量数据点图整合,该方法创建了强大的探索工具,使研究者能够直观地发现模式、形成假设并指导后续实验设计。这种方法的真正力量不仅在于其呈现数据的能力,更在于其促进科学发现的能力。它架起了数据分析和生物学解释之间的桥梁,将抽象的数值转化为可视的进化故事,极大地增强了我们对基因组复杂性、进化动态和功能适应的理解。
2026-02-03 00:30:00
65
原创 【科研绘图系列】R语言绘制多种论文图形
总结而言,这段代码代表了真菌进化基因组学中"系统发育意识"(phylogenetic awareness)统计分析的范式实践。其科学价值在于区分了两种进化假说:基因组扩张是否通过重复序列积累实现?这种关联是系统发育保守性的假象(即近缘物种因共享祖先而同时具有大基因组和高重复序列),还是真实的功能/选择关联?PIC方法通过将跨物种比较转化为支系内比较,有效剥离了系统发育自相关,使因果推断更为可靠。方法论层面,代码示范了系统发育比较分析的标准 workflow:数据-树匹配→独立对比计算→对比值回归→原始数据可
2026-02-02 00:30:00
78
原创 【科研绘图系列】R语言绘制图进化关系图
总结而言,这段代码代表了进化真菌学中性状宏观进化分析的标准范式。其科学价值在于将静态的分类学观察(某物种是病原或腐生)转化为动态的历史推断(祖先节点状态的概率分布),从而揭示生活方式转变的进化轨迹。ARD模型的选择体现了对复杂进化过程的尊重——非对称转换速率的估计可识别"病原化"或"去病原化"的主导方向,为适应性假说检验提供量化基础。方法论层面,代码示范了系统发育比较方法(PCM)的基本 workflow:数据整合→模型拟合→概率推断→树形可视化,形成从原始数据到进化结论的完整链条。
2026-02-02 00:15:00
231
原创 【科研绘图系列】R语言绘制图时间序列分布图
总结而言,这段代码代表了微生物生理学研究中大样本量生长曲线比较分析的标准可视化范式。其科学价值在于建立了"时间-表型-环境"三维数据的整合展示框架,通过温度梯度实验揭示生活方式与热适应性的潜在关联——病原菌通常在37°C(哺乳动物体温)表现出更优生长,而腐生菌可能在较低温度(33°C)具有适应性优势。方法论层面,代码示范了如何处理高维表型数据的分层结构(生活方式→属→菌株),并通过嵌套分面系统实现复杂实验设计的清晰呈现。
2026-02-01 00:15:00
89
原创 【科研绘图系列】R语言绘制图显著差异的堆积图(stacked boxplot with label)
总结而言,这段代码代表了真菌基因组学研究中组装质量报告的标准可视化范式。其科学价值在于建立了"标准化指标-归一化展示-跨样本比较"的质量评估流程,BUSCO框架的应用使不同研究团队、不同测序平台的基因组数据具备可比性,解决了基因组学领域长期存在的"组装质量描述主观性"问题。方法论层面,代码示范了如何处理分类学命名清洗、多类别比例数据的堆叠可视化,以及注释标记的精确空间定位。
2026-02-01 00:15:00
216
原创 【科研绘图系列】R语言绘制图相关系数散点图(correlation scatterplot)
总结而言,这段代码代表了微生物系统生物学中"基因型-表型映射"(genotype-phenotype mapping)研究的标准分析范式。其科学价值在于建立了从基因组特征到生理表型的定量桥梁,通过双底物比较实验设计,揭示了代谢策略相关基因含量与生长动力学参数的条件依赖性关联。方法论层面,代码示范了如何将实验误差传播、分层统计建模与多层次可视化整合为可重复的分析流程。
2026-01-31 09:52:52
414
原创 【科研绘图系列】R语言绘制图箱线图(boxplot)
总结而言,这段代码代表了进化真菌学领域功能基因组比较研究的标准分析范式。其科学价值在于建立了"基因家族计数-功能类别比率-生活方式关联"的分析链条,为从基因组层面解析真菌生态位分化提供了可量化、可重复的框架。方法论层面,代码示范了如何整合分类学信息重构、系统发育独立性控制、统计检验与出版级可视化于一体,形成完整的数据分析 pipeline。
2026-01-31 09:50:56
263
原创 【科研绘图系列】R语言绘制图多组箱线图(boxplot)
该代码对真菌进化基因组学研究具有直接参考价值,其比较框架可扩展至其他微生物类群的生活方式演化研究。更重要的是,它示范了R语言生态系统中tidyverse工具链(ggplot2、reshape2等)在生物信息学数据后处理中的强大能力,特别是将原始统计表格转化为出版级图形的完整工作流。对于学习者而言,这段代码不仅提供了可复用的可视化模板,更传递了计算生物学研究中数据完整性验证、统计方法选择、图形美学设计等隐性知识,是连接生物信息学分析与科学传播的桥梁性资源。
2026-01-28 09:20:05
118
原创 【科研绘图系列】R语言绘制图ggtree基因组数据可视化教程介绍
本教程代码为真菌基因组比较研究提供了一套完整的数据可视化解决方案,其核心优势体现在三个层面。在数据整合层面,成功将系统发育树、基因组组成数据和生态学元数据融合为统一的视觉叙事,通过ggtree的facet功能实现了"一棵树+多组数据"的经典布局,这种设计既保留了进化关系背景,又展示了定量特征变异。在统计分析层面,采用非参数的Wilcoxon检验处理小样本生活方式比较,箱线图与抖动图的组合兼顾了统计摘要和原始数据展示,符合当前数据透明化的学术趋势。
2026-01-28 09:13:24
896
原创 【文献分享】OTMODE一种基于最优传输理论的框架,用于在单细胞多组学数据中识别差异特征
单细胞技术能够进行高分辨率的细胞研究,但因数据复杂性而面临识别差异特征的难题。我们提出了 OTMODE 这一非参数方法,它采用了不平衡的辛普朗算法和瓦尔德检验,旨在提升单细胞多组学数据中的差异特征识别能力。在模拟实验中,OTMODE 表现出了卓越的性能(平均 F1 分数为 90%;平均 AUC 分数为 92%),并且效率很高(处理 5000 个细胞仅需 2.2 秒)。在实际应用中,它在检测有意义的过程方面比其他最先进的方法更具敏感性,并且能够通过识别自动注释工具中可能存在的错误注释簇来评估注释准确性。此外
2026-01-26 09:04:17
618
原创 【文献分享】EXPLANA一种用户友好型的工作流程,适用于横断面和纵向微生物组研究中的探索性分析和特征选择。
纵向微生物组研究(LMS)正变得越来越常见,但其分析过程中存在一些挑战,比如数据并非相互独立,这就需要使用混合效应模型来处理。此外,大量的数据促使进行探索性分析,以确定与结果变量相关的因素。尽管变化分析(即计算不同时间点特征的变化)可能非常有效,但如何最好地进行这些分析往往并不明确。例如,观察性的 LMS 测量显示出自然波动,因此基线可能不是主要关注的参考点,而对于干预性的 LMS,基线通常是关键的参考点,通常表示治疗的开始。
2026-01-26 09:01:28
834
原创 【文献分享】MedMPT一种用于多种临床呼吸系统疾病应用的视觉语言预训练转换器
通用人工智能模型在应用于临床实践中的多种模态和复杂临床任务时面临独特的挑战。在此,我们介绍了 MedMPT,这是一个面向临床、专为呼吸系统医疗保健设计的多功能预训练模型,基于 154,274 对胸部计算机断层扫描图像和放射学报告进行训练。MedMPT 采用自监督学习来获取医学见解,能够处理多模态临床数据,并支持与临床工作流程相契合的各种临床任务。我们在涉及常见医学模态(如计算机断层扫描图像、放射学报告、实验室检测和药物关系图)的广泛胸部相关病理状况上评估了 MedMPT 的性能。MedMPT 在医疗领域的多
2026-01-15 20:21:53
599
原创 【文献分享】LyMOI一种结合深度学习和大规模语言模型的用于解读组学数据的工作流程
通过对海量组学数据进行分子全景分析,可以识别细胞中的调控网络,但还需要进行机制解读和实验验证。在此,我们结合深度学习和大型语言模型推理,开发了一种用于组学解读的混合工作流程,称为 LyMOI。LyMOI 采用了 GPT-3.5 来进行生物学知识推理,并使用了一个包含图卷积网络(GCN)的大型图模型。该大型图模型整合了进化上保守的蛋白质相互作用,并通过分层微调从多组学数据中预测特定环境下的分子调节因子。然后,GPT-3.5 生成机器的推理链(CoT),以机制上解读其在生物系统中的作用。以自噬为例,LyMOI
2026-01-15 12:03:18
975
原创 【文献分享】SpatialZ弥合从平面空间转录组学到三维细胞图谱之间的维度差距
空间转录组学(ST)极大地改变了我们对组织结构的理解,但构建全面的三维(3D)细胞图谱仍面临技术限制和高昂成本的挑战。目前的方法通常只能捕获稀疏采样的二维切片,留下了大量空白区域,限制了我们对连续器官组织结构的理解。在此,我们提出了 SpatialZ,这是一个计算框架,通过在实验测量的切片之间生成虚拟切片来填补这些空白,从而能够从平面 ST 数据中构建密集的 3D 细胞图谱。SpatialZ 旨在以单细胞分辨率运行,并且不受特定空间技术固有的基因覆盖限制的影响。全面的验证表明,SpatialZ 能准确地保留
2026-01-09 09:03:40
984
原创 【文献分享】CIMA千万级免疫细胞图谱发布,为AI时代大健康绘制“生命导航图”
理解驱动人类免疫差异的基因调控机制对于阐明免疫介导疾病易感性至关重要。单细胞基因组学的出现为追踪这些基因效应对基因调控的影响提供了必要的分辨率,从而揭示它们在细胞类型和特定环境条件下如何在免疫系统的整个连续过程中发挥作用。
2026-01-09 09:00:55
661
原创 【文献分享】利用 CONCORD 技术揭示单细胞数据集中的统一细胞状态图谱
利用 CONCORD 在单细胞数据集中揭示一致的细胞状态图谱 从单细胞数据中揭示潜在的细胞状态图谱需要克服批处理整合、去噪和降维等关键障碍。在此,我们提出了 CONCORD,这是一个统一的框架,能够在单个自监督模型中同时解决这些挑战。其核心是实施一种概率抽样策略,通过数据集感知抽样来纠正批处理效应,并通过硬负样本抽样来提高生物学分辨率。仅使用一个具有单个隐藏层的极简神经网络和对比学习,CONCORD 超越了最先进的性能,而不依赖于深度架构、辅助损失或外部监督。它无缝地整合了不同批次、技术甚至物种的数据,以生
2026-01-08 19:00:44
796
原创 【文献分享】利用 SPLISOSM 从空间转录组学数据中解析基因型别及调控机制
转录多样性(包括剪接和不同的 3' 端使用方式)对于细胞的特性和适应能力至关重要,但其空间协调机制却尚未得到充分理解。在此,我们提出了 SPLISOSM(空间异构体统计建模)这一方法,用于从空间转录组学数据中检测异构体分辨模式。SPLISOSM 采用多元检验和非参数核方法来考虑斑点级别和异构体级别的相关性,从而在稀疏数据上实现了高统计效力。在小鼠大脑中,我们识别出了超过 1000 个空间变化的转录多样性事件,这些事件主要出现在与神经精神疾病相关的突触信号通路中,并揭示了与区域特异性 RNA 结合蛋白相关的既
2026-01-08 18:58:30
681
原创 【文献分享】TransBrain:一种用于在人类与小鼠之间转换全脑表型的计算框架
尽管全脑成像技术取得了进步,但缺乏能够将啮齿动物临床研究与人类研究联系起来的定量方法仍然是一个关键的挑战。在此,我们推出了 TransBrain,这是一个计算框架,能够实现人类和小鼠大脑整体表型的双向转换。TransBrain 通过以下方式提高了人类与小鼠同源性映射的准确性:(1)一个基于皮质和皮质下分离区域的特定深度神经网络,该网络基于整合的多模态人类转录组学进行训练,以改善皮质对应关系(比原始转录组提高了 89.5%),揭示了 2 个进化上保守的梯度;(2)一种基于图的方法来构建一个统一的跨物种表征空间
2026-01-07 08:57:25
818
原创 代谢组数据分析(三十二):多组学[代谢组]数据整合的微生物与宿主互作网络构建及可视化分析
本教程通过详细的步骤和方法,展示了如何整合微生物群落数据、宿主基因表达数据和代谢组数据,构建微生物与宿主互作网络,并进行可视化分析。这种方法为研究微生物与宿主之间的复杂关系提供了一种有力的工具,有助于推动相关疾病的研究和治疗。然而,在实际应用中,需要注意数据处理和分析过程中的各种问题,并结合实验验证来提高研究结果的可靠性和科学性。
2026-01-07 08:51:43
269
原创 【数据分析】R语言深入探索生物传感器数据的可视化与异质性分析
我们通过一系列数据分析步骤,深入探讨了生物传感器数据的可视化和异质性分析。通过对实验数据的预处理、可视化处理和异质性分析,我们揭示了生物传感器在不同条件下的响应模式,并评估了数据的可重复性。这些分析结果为我们理解生物传感器在复杂生物环境中的动态行为提供了重要的线索。
2026-01-02 00:45:00
313
1
原创 【数据分析】R语言基于高斯混合模型与多参数聚类的亚群识别与表征
本研究系统地表征了微生物发酵中的细胞异质性现象,建立了分析框架,并揭示了其与产物合成的关联。这些成果不仅加深了我们对微生物群体行为的理解,也为发酵工程的实际应用提供了新思路和新工具。随着单细胞技术的不断进步,类似的精细分析将成为发酵优化和合成生物学研究的标准方法,推动整个领域向更精准、更高效的方向发展。
2026-01-02 00:30:00
66
原创 【数据分析】基于R语言的聚类、时间序列及生存率分析在生物传感器数据中的应用
通过上述代码的运行,我们得到了一系列丰富的数据分析结果。这些结果不仅包括了不同实验条件下的细胞响应模式,还包括了时间序列分析、生存率分析和再生长动力学分析的结果。通过这些分析,我们能够更深入地理解生物传感器在不同实验条件下的响应特性。在聚类分析中,我们通过`mclust`包将细胞分为不同的亚群,并进一步分析了这些亚群的特征。通过时间序列分析,我们观察到了不同细胞在不同时间点的pH值变化。通过生存率分析,我们评估了不同处理条件对细胞存活的影响。通过再生长动力学分析,我们评估了不同处理条件对细胞再生长的影响
2026-01-01 00:30:00
232
原创 【数据分析】R语言多元统计方法探索生物传感器数据分析与可视化教程
通过上述代码的运行,我们得到了一系列丰富的数据分析结果。这些结果不仅包括了不同实验条件下的平均信号和标准误差,还包括了回归分析的结果和显著性检验的结果。通过这些分析,我们可以更深入地理解不同实验条件下生物传感器的响应特性。
2026-01-01 00:15:00
180
原创 【文献分享】ADMGCN:采用元学习模式的图卷积网络用于阿尔茨海默病诊断
阿尔茨海默病(AD)是一种神经退行性疾病,其特征为记忆力丧失和认知能力下降。由于图卷积网络(GCN)能够处理结构信息并融合多模态特征,因此在 AD 诊断方面已成为颇受欢迎的工具。然而,深度学习方法面临着诸多挑战,包括需要大量数据集以及对 AD 研究中标签分布的不均衡性敏感。为了解决这些限制并增强 GCN 的灵活性,我们提出了一种基于元学习范式的图卷积网络(ADMGCN)用于早期 AD 诊断。该方法通过加权和降维来提高性能、存储效率和训练效率。通过利用元学习,我们对受试者进行采样以创建众多标签均衡的任务,从而
2025-12-31 08:45:05
1101
原创 【文献分享】MetaMDA:利用微生物-代谢物-药物异质网络中的随机游走实现微生物-药物关联的可解释预测
与人类共生的微生物在生理过程和疾病发展(包括癌症)中起着关键作用。预测微生物-药物关联(MDA)能够促进药物研发和个性化医疗。然而,现有的方法无法预测那些未包含在已标注数据中的微生物或药物的关联,并且它们也无法模拟微生物与药物之间潜在的生物学机制。为了解决这些局限性,我们提出了一种新颖的计算框架,名为 MetaMDA,用于通过在微生物-代谢物-药物异构网络上进行随机游走来预测 MDA。MetaMDA 首先构建一个整合了微生物、代谢物和药物的异构图,从而能够模拟复杂的生物学相互作用。随后,应用具有定制转移概率
2025-12-31 08:43:03
1155
原创 【文献分享】PepQueryMHC:基于免疫肽组学数据实现肿瘤抗原的快速全面筛选
确定 MHC 结合肽的肿瘤特异性对于癌症免疫疗法的发展至关重要,但目前的方法在处理 II 类肽和非参考序列方面存在困难。我们推出了 PepQueryMHC 这一超快速工具,它将 MHC 结合肽序列与转录的 RNA 测序读数相结合,以实现对肿瘤抗原的高效优先排序。我们展示了其在优先排序 I 类和 II 类肿瘤抗原、确定呈递肽的细胞来源以及解决有关蛋白酶体剪接肽的流行程度的不确定性方面的灵活性。
2025-12-26 08:42:56
664
### 【生物信息学】基于R语言的STAMP图绘制:宏基因组数据分析与可视化
2025-04-20
### 数据科学R语言基础图形合集:科研绘图指南与实现
2025-04-20
科研绘图R语言ggpubr包在数据可视化中的应用:多种图表类型与统计分析整合
2025-04-20
科研绘图基于ggplot2的箱线图绘制:带有出现率百分比的多组别数据分布比较及可视化
2025-04-20
科研绘图领域:tidyplots包替代ggplot2实现高效美观的论文图表制作
2025-03-25
科研绘图系列:R与Python在数据可视化中的应用及代码比较
2025-03-25
在R语言中,安装R包是数据分析过程中不可或缺的一部分 当你需要执行特定的统计测试、可视化或其他任务时,你可能会发现相应的功能已经被封装在一个或多个R包中
2025-01-23
数据分析:转录组差异分析总结(DESeq2+limma+edgeR+t-test/wilcox-test
2024-11-19
科研绘图系列:R语言雨云图展示更多数据分布信息
2024-11-18
科研绘图系列:箱线图加百分比点图展示组间差异
2024-11-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅