自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

专注生信领域

多组学数据分析、数理统计、机器学习、SCI科研绘图

  • 博客(1018)
  • 收藏
  • 关注

原创 数据分析:转录组差异分析方法总结(DESeq2+limma+edgeR+t-test/wilcox-test)

本文详细探讨了转录组数据分析中常用的差异分析R包(如DESeq2、limma和edgeR)及其与t-test/wilcox-rank-sum test的结合使用。文章首先介绍了如何下载和导入测试数据,并批量安装所需的R包。接着,讨论了基因表达count矩阵的标准化方法(如FPKM、TPM等),以及如何通过PCA、tSNE、UMAP和热图等方法进行基因整体水平分布的可视化。随后,文章分别展示了DESeq2、limma和edgeR的差异分析实现及结果解析,并探讨了结合t-test或wilcox-rank-sum

2023-07-17 11:01:18 25383 2

原创 【文献分享】OSDR基于空间截面的时态组织动态分析

生理和病理过程(如炎症和癌症)是由细胞间相互作用随时间演化而产生的。然而,由于组织活检只能提供单一时间点的"快照",传统方法难以追踪人体组织内细胞群体随时间的变化动态

2026-03-19 18:34:31 505

原创 【文献分享】利用 Evo 2 在生命的所有领域进行基因组建模与设计

Evo 2 能够准确预测基因变异(从非编码致病突变到具有临床意义的 BRCA1 变异)的功能影响,无需针对特定任务进行微调。机制可解释性分析表明,Evo 2 学习与生物学特征相关的表示,包括外显子-内含子边界、转录因子结合位点、蛋白质结构元素和噬菌体基因组区域。Evo 2 的生成能力能够在基因组层面生成线粒体、原核生物和真核生物的序列,其自然度和连贯性比以往的方法更高。Evo 2 还在预测模型3、4 的引导下以及在推理时间搜索的辅助下,能够生成经过实验证实的染色质可及性模式。我们已将 Evo 2 完全开放,

2026-03-19 18:28:28 358

原创 【数据分析】使用LSTM自编码器进行肠道微生物组时间序列异常检测的完整教程

严格的患者级别数据划分防止信息泄漏;基于临床指标构建可解释的代理标签;采用LSTM自编码器无监督学习正常菌群动态;通过验证集优化阈值确保泛化能力。最终模型在测试集上达到88.68%的ROC-AUC和99.6%的召回率,展现了出色的异常识别能力。

2026-03-14 13:26:47 126

原创 【文献分享】CeLLTra:通过基于通路的转换器将细胞名称与基因表达相匹配

单细胞 RNA 测序(scRNA-Seq)技术能够对单个细胞层面的基因表达进行详细探究,这对于标注细胞类型和理解细胞多样性至关重要。传统的细胞类型标注方法通常依赖于标志基因和人工标注,但由于数据质量低和参考数据集不完整等原因,存在诸多挑战。我们开发了 CeLLTra,这是一种新颖的对比学习框架,它利用基于 Transformer 的模型整合生物通路信息,将基因整合为超级标记,从而有效地从 scRNA-Seq 数据中捕获全面的基因表达。通过将这种基于通路信息的 Transformer 与预训练的特定领域语言

2026-03-03 08:55:53 607

原创 【数据分析】(荟萃分析三)“入侵外来物种对陆生昆虫生物多样性影响”--针对 “物种丰富度(Species richness)” 指标的元分析

## 总结1. **核心目标**:量化入侵物种对陆生昆虫丰度和物种丰富度的影响效应,识别调节该效应的关键因素(如昆虫目、入侵物种类型),并验证结果的稳健性;2. **技术逻辑**:遵循 “数据清洗→核心指标分析→补充指标验证→敏感性检验” 的元分析标准流程,适配生态数据的多层非独立性特点,采用改进的统计方法(如多层 Egger 回归)保证分析的科学性;3. **研究价值**:从丰度和丰富度两个维度全面回答 “入侵物种如何影响昆虫生物多样性”,为入侵生物学的理论研究和实践防控提供量化证据。

2026-03-03 00:15:00 148

原创 【数据分析】(荟萃分析二)“入侵外来物种对陆生昆虫生物多样性影响”--针对 “丰度(Abundance)” 指标的核心元分析

1. 核心目标:量化入侵物种对昆虫丰度的整体影响效应,并明确昆虫目、入侵物种类型、地理环境(岛屿 / 大陆)、飞行能力等因素是否调节该效应;2. 关键价值:通过严格的统计校正(小样本偏差、发表偏倚、非独立性)和多维度敏感性分析,保证元分析结果的可靠性和稳健性;3. 最终产出:入侵物种对昆虫丰度影响的核心效应值、各调节因素的作用方向 / 显著性、一系列符合学术规范的可视化图表,以及验证结果稳健性的敏感性分析证据。

2026-03-02 19:31:10 235

原创 【数据分析】(荟萃分析一)“入侵外来物种对陆生昆虫生物多样性影响” --数据清洗与探索性分析

1. 核心目标:将原始非标准化数据整理为统一、规范的格式,消除数据不一致性(如误差类型、分类标签),为元分析模型提供高质量输入数据;2. 关键价值:通过探索性分析和可视化,全面展现数据的时间、地理、分类、数值特征,帮助理解数据集的结构和分布特点,为后续元分析的模型选择、分组策略提供依据;3. 最终产出:一份可直接用于元分析的清洗后数据集,以及一系列展现数据特征的可视化图表,支撑后续的元分析结论解读。

2026-03-02 19:15:18 107

原创 【数据分析】讲义:线性混合模型 LMM(重复测量的中心–病人数据)

1. 识别哪些临床数据需要 LMM(重复测量、中心-病人分层、相关性)2. 写出并理解 LMM 公式:固定效应 vs 随机效应3. 会建:随机截距模型、随机斜率模型、中心/病人嵌套模型4. 会解释输出:固定效应系数、随机效应方差、ICC、个体差异5. 会比较模型:AIC、LRT(似然比检验)、REML/ML 的使用规则6. 能做基本诊断与预测:残差、随机效应、边际均值、个体预测

2026-03-01 00:30:00 370

原创 【数据分析】python历史与未来云量变化驱动的生产力效应

**技术亮点**包括:xesmf重网格化实现多分辨率数据融合,纬度余弦加权确保全球平均的物理严谨性,以及双时间轴布局(前三图1984-2025年、底图1984-2100年)的巧妙设计。代码的模块化结构(敏感性计算、多源读取、归因分析、可视化)便于扩展至其他驱动因子(如温度、CO₂)的类似归因研究。**应用价值**在于为IPCC评估报告提供云-碳反馈的观测约束,特别是当前地球系统模型对云量变化生态效应模拟存在显著不确定性的背景下。结果可为生态系统管理(如干旱区绿化潜力评估)和气候政策(如碳汇稳定性考量)提

2026-03-01 00:15:00 190

原创 【数据分析】python年际云量变化对植被生产力的影响

**技术亮点**包括:年际差分法有效分离长期趋势,邻域回归平衡空间分辨率与统计稳健性,以及跨尺度一致性分类图的创新可视化。代码的模块化结构(数据读取、邻域回归、尺度对比、可视化)便于扩展至其他环境因子(如温度、CO₂)的跨尺度研究。**应用价值**在于为地球系统模型(ESMs)评估提供基准:当前模型常基于瞬时响应参数化云-碳耦合,若季节与年际响应确实存在系统性差异,则模型需引入记忆效应或适应机制的参数化改进。结果对预测云量变化(如增云增雨趋势)的生态系统后果具有直接政策相关性。

2026-02-28 13:44:35 81

原创 【数据分析】python云量敏感性机制:降水与光照效应的权衡

使用statsmodels进行专业统计诊断,sklearn实现高效机器学习回归,以及LaTeX格式标签的专业制图。代码的模块化设计(数据读取、机制计算、统计建模、可视化分离)便于迁移至其他生态系统响应研究。结果可为CMIP6等全球气候模型改进云-碳反馈参数化提供关键观测证据,特别是在当前模型普遍低估云量变化生态效应的背景下具有重要应用价值。

2026-02-28 13:41:18 199

原创 【文献分享】scHiCAR利用 scHiCAR 技术对复杂组织中的转录组、表观基因组和三维基因组进行三模态单细胞分析

顺式调控元件(CREs)的三维(3D)组织在转录控制中至关重要。然而,从同一单细胞中捕获转录组、表观基因组和 3D 基因组仍然具有挑战性。在此,我们介绍了 scHiCAR(单细胞 Hi-C 与转座酶可及染色质和 RNA 测序的组合),这是一种基于平板的组合条形码方法,可同时从同一细胞中对 mRNA、开放染色质和染色体构象捕获进行分析。与现有的单细胞 3D 基因组方法相比,scHiCAR 更有效地富集了锚定在候选 CREs(cCREs)上的长程顺式相互作用。将其应用于 162 万个小鼠脑细胞,并结合基于深度学

2026-02-27 20:45:49 737

原创 【数据分析】python探究云量变化对植被生产力的影响

本代码实现了一套完整的云量-生产力敏感性分析流程,核心贡献在于揭示了云量变化对植被生产力的影响随气候干旱度呈现系统性转变的科学规律。主要结论体现在三个方面:第一,方法学创新。 代码构建了从站点观测到全球模拟的多尺度验证框架,通过标准化处理消除量纲差异,使地面通量塔观测与遥感模型结果具有可比性。密度估计函数的引入解决了海量格点数据可视化的重叠问题,显著提升了全球格局图的判读性。第二,生态学发现。 图形输出预期将显示:在干旱区(AI<1),云量增加可能通过降低辐射胁迫和蒸散发损耗而促进GPP(正敏感性);在

2026-02-27 10:18:46 37

原创 【科研绘图系列】R语言绘制图系统发育树结合的基因表达图

本文介绍的可视化方法体现了现代计算生物学的核心原则:将数据、算法和可视化紧密结合,以产生有意义的生物学洞见。通过将系统发育树与定量数据点图整合,该方法创建了强大的探索工具,使研究者能够直观地发现模式、形成假设并指导后续实验设计。这种方法的真正力量不仅在于其呈现数据的能力,更在于其促进科学发现的能力。它架起了数据分析和生物学解释之间的桥梁,将抽象的数值转化为可视的进化故事,极大地增强了我们对基因组复杂性、进化动态和功能适应的理解。

2026-02-03 00:30:00 65

原创 【科研绘图系列】R语言绘制多种论文图形

总结而言,这段代码代表了真菌进化基因组学中"系统发育意识"(phylogenetic awareness)统计分析的范式实践。其科学价值在于区分了两种进化假说:基因组扩张是否通过重复序列积累实现?这种关联是系统发育保守性的假象(即近缘物种因共享祖先而同时具有大基因组和高重复序列),还是真实的功能/选择关联?PIC方法通过将跨物种比较转化为支系内比较,有效剥离了系统发育自相关,使因果推断更为可靠。方法论层面,代码示范了系统发育比较分析的标准 workflow:数据-树匹配→独立对比计算→对比值回归→原始数据可

2026-02-02 00:30:00 78

原创 【科研绘图系列】R语言绘制图进化关系图

总结而言,这段代码代表了进化真菌学中性状宏观进化分析的标准范式。其科学价值在于将静态的分类学观察(某物种是病原或腐生)转化为动态的历史推断(祖先节点状态的概率分布),从而揭示生活方式转变的进化轨迹。ARD模型的选择体现了对复杂进化过程的尊重——非对称转换速率的估计可识别"病原化"或"去病原化"的主导方向,为适应性假说检验提供量化基础。方法论层面,代码示范了系统发育比较方法(PCM)的基本 workflow:数据整合→模型拟合→概率推断→树形可视化,形成从原始数据到进化结论的完整链条。

2026-02-02 00:15:00 231

原创 【科研绘图系列】R语言绘制图时间序列分布图

总结而言,这段代码代表了微生物生理学研究中大样本量生长曲线比较分析的标准可视化范式。其科学价值在于建立了"时间-表型-环境"三维数据的整合展示框架,通过温度梯度实验揭示生活方式与热适应性的潜在关联——病原菌通常在37°C(哺乳动物体温)表现出更优生长,而腐生菌可能在较低温度(33°C)具有适应性优势。方法论层面,代码示范了如何处理高维表型数据的分层结构(生活方式→属→菌株),并通过嵌套分面系统实现复杂实验设计的清晰呈现。

2026-02-01 00:15:00 89

原创 【科研绘图系列】R语言绘制图显著差异的堆积图(stacked boxplot with label)

总结而言,这段代码代表了真菌基因组学研究中组装质量报告的标准可视化范式。其科学价值在于建立了"标准化指标-归一化展示-跨样本比较"的质量评估流程,BUSCO框架的应用使不同研究团队、不同测序平台的基因组数据具备可比性,解决了基因组学领域长期存在的"组装质量描述主观性"问题。方法论层面,代码示范了如何处理分类学命名清洗、多类别比例数据的堆叠可视化,以及注释标记的精确空间定位。

2026-02-01 00:15:00 216

原创 【科研绘图系列】R语言绘制图相关系数散点图(correlation scatterplot)

总结而言,这段代码代表了微生物系统生物学中"基因型-表型映射"(genotype-phenotype mapping)研究的标准分析范式。其科学价值在于建立了从基因组特征到生理表型的定量桥梁,通过双底物比较实验设计,揭示了代谢策略相关基因含量与生长动力学参数的条件依赖性关联。方法论层面,代码示范了如何将实验误差传播、分层统计建模与多层次可视化整合为可重复的分析流程。

2026-01-31 09:52:52 414

原创 【科研绘图系列】R语言绘制图箱线图(boxplot)

总结而言,这段代码代表了进化真菌学领域功能基因组比较研究的标准分析范式。其科学价值在于建立了"基因家族计数-功能类别比率-生活方式关联"的分析链条,为从基因组层面解析真菌生态位分化提供了可量化、可重复的框架。方法论层面,代码示范了如何整合分类学信息重构、系统发育独立性控制、统计检验与出版级可视化于一体,形成完整的数据分析 pipeline。

2026-01-31 09:50:56 263

原创 【科研绘图系列】R语言绘制图多组箱线图(boxplot)

该代码对真菌进化基因组学研究具有直接参考价值,其比较框架可扩展至其他微生物类群的生活方式演化研究。更重要的是,它示范了R语言生态系统中tidyverse工具链(ggplot2、reshape2等)在生物信息学数据后处理中的强大能力,特别是将原始统计表格转化为出版级图形的完整工作流。对于学习者而言,这段代码不仅提供了可复用的可视化模板,更传递了计算生物学研究中数据完整性验证、统计方法选择、图形美学设计等隐性知识,是连接生物信息学分析与科学传播的桥梁性资源。

2026-01-28 09:20:05 118

原创 【科研绘图系列】R语言绘制图ggtree基因组数据可视化教程介绍

本教程代码为真菌基因组比较研究提供了一套完整的数据可视化解决方案,其核心优势体现在三个层面。在数据整合层面,成功将系统发育树、基因组组成数据和生态学元数据融合为统一的视觉叙事,通过ggtree的facet功能实现了"一棵树+多组数据"的经典布局,这种设计既保留了进化关系背景,又展示了定量特征变异。在统计分析层面,采用非参数的Wilcoxon检验处理小样本生活方式比较,箱线图与抖动图的组合兼顾了统计摘要和原始数据展示,符合当前数据透明化的学术趋势。

2026-01-28 09:13:24 896

原创 【文献分享】OTMODE一种基于最优传输理论的框架,用于在单细胞多组学数据中识别差异特征

单细胞技术能够进行高分辨率的细胞研究,但因数据复杂性而面临识别差异特征的难题。我们提出了 OTMODE 这一非参数方法,它采用了不平衡的辛普朗算法和瓦尔德检验,旨在提升单细胞多组学数据中的差异特征识别能力。在模拟实验中,OTMODE 表现出了卓越的性能(平均 F1 分数为 90%;平均 AUC 分数为 92%),并且效率很高(处理 5000 个细胞仅需 2.2 秒)。在实际应用中,它在检测有意义的过程方面比其他最先进的方法更具敏感性,并且能够通过识别自动注释工具中可能存在的错误注释簇来评估注释准确性。此外

2026-01-26 09:04:17 618

原创 【文献分享】EXPLANA一种用户友好型的工作流程,适用于横断面和纵向微生物组研究中的探索性分析和特征选择。

纵向微生物组研究(LMS)正变得越来越常见,但其分析过程中存在一些挑战,比如数据并非相互独立,这就需要使用混合效应模型来处理。此外,大量的数据促使进行探索性分析,以确定与结果变量相关的因素。尽管变化分析(即计算不同时间点特征的变化)可能非常有效,但如何最好地进行这些分析往往并不明确。例如,观察性的 LMS 测量显示出自然波动,因此基线可能不是主要关注的参考点,而对于干预性的 LMS,基线通常是关键的参考点,通常表示治疗的开始。

2026-01-26 09:01:28 834

原创 【文献分享】MedMPT一种用于多种临床呼吸系统疾病应用的视觉语言预训练转换器

通用人工智能模型在应用于临床实践中的多种模态和复杂临床任务时面临独特的挑战。在此,我们介绍了 MedMPT,这是一个面向临床、专为呼吸系统医疗保健设计的多功能预训练模型,基于 154,274 对胸部计算机断层扫描图像和放射学报告进行训练。MedMPT 采用自监督学习来获取医学见解,能够处理多模态临床数据,并支持与临床工作流程相契合的各种临床任务。我们在涉及常见医学模态(如计算机断层扫描图像、放射学报告、实验室检测和药物关系图)的广泛胸部相关病理状况上评估了 MedMPT 的性能。MedMPT 在医疗领域的多

2026-01-15 20:21:53 599

原创 【文献分享】LyMOI一种结合深度学习和大规模语言模型的用于解读组学数据的工作流程

通过对海量组学数据进行分子全景分析,可以识别细胞中的调控网络,但还需要进行机制解读和实验验证。在此,我们结合深度学习和大型语言模型推理,开发了一种用于组学解读的混合工作流程,称为 LyMOI。LyMOI 采用了 GPT-3.5 来进行生物学知识推理,并使用了一个包含图卷积网络(GCN)的大型图模型。该大型图模型整合了进化上保守的蛋白质相互作用,并通过分层微调从多组学数据中预测特定环境下的分子调节因子。然后,GPT-3.5 生成机器的推理链(CoT),以机制上解读其在生物系统中的作用。以自噬为例,LyMOI

2026-01-15 12:03:18 975

原创 【文献分享】SpatialZ弥合从平面空间转录组学到三维细胞图谱之间的维度差距

空间转录组学(ST)极大地改变了我们对组织结构的理解,但构建全面的三维(3D)细胞图谱仍面临技术限制和高昂成本的挑战。目前的方法通常只能捕获稀疏采样的二维切片,留下了大量空白区域,限制了我们对连续器官组织结构的理解。在此,我们提出了 SpatialZ,这是一个计算框架,通过在实验测量的切片之间生成虚拟切片来填补这些空白,从而能够从平面 ST 数据中构建密集的 3D 细胞图谱。SpatialZ 旨在以单细胞分辨率运行,并且不受特定空间技术固有的基因覆盖限制的影响。全面的验证表明,SpatialZ 能准确地保留

2026-01-09 09:03:40 984

原创 【文献分享】CIMA千万级免疫细胞图谱发布,为AI时代大健康绘制“生命导航图”

理解驱动人类免疫差异的基因调控机制对于阐明免疫介导疾病易感性至关重要。单细胞基因组学的出现为追踪这些基因效应对基因调控的影响提供了必要的分辨率,从而揭示它们在细胞类型和特定环境条件下如何在免疫系统的整个连续过程中发挥作用。

2026-01-09 09:00:55 661

原创 【文献分享】利用 CONCORD 技术揭示单细胞数据集中的统一细胞状态图谱

利用 CONCORD 在单细胞数据集中揭示一致的细胞状态图谱 从单细胞数据中揭示潜在的细胞状态图谱需要克服批处理整合、去噪和降维等关键障碍。在此,我们提出了 CONCORD,这是一个统一的框架,能够在单个自监督模型中同时解决这些挑战。其核心是实施一种概率抽样策略,通过数据集感知抽样来纠正批处理效应,并通过硬负样本抽样来提高生物学分辨率。仅使用一个具有单个隐藏层的极简神经网络和对比学习,CONCORD 超越了最先进的性能,而不依赖于深度架构、辅助损失或外部监督。它无缝地整合了不同批次、技术甚至物种的数据,以生

2026-01-08 19:00:44 796

原创 【文献分享】利用 SPLISOSM 从空间转录组学数据中解析基因型别及调控机制

转录多样性(包括剪接和不同的 3' 端使用方式)对于细胞的特性和适应能力至关重要,但其空间协调机制却尚未得到充分理解。在此,我们提出了 SPLISOSM(空间异构体统计建模)这一方法,用于从空间转录组学数据中检测异构体分辨模式。SPLISOSM 采用多元检验和非参数核方法来考虑斑点级别和异构体级别的相关性,从而在稀疏数据上实现了高统计效力。在小鼠大脑中,我们识别出了超过 1000 个空间变化的转录多样性事件,这些事件主要出现在与神经精神疾病相关的突触信号通路中,并揭示了与区域特异性 RNA 结合蛋白相关的既

2026-01-08 18:58:30 681

原创 【文献分享】TransBrain:一种用于在人类与小鼠之间转换全脑表型的计算框架

尽管全脑成像技术取得了进步,但缺乏能够将啮齿动物临床研究与人类研究联系起来的定量方法仍然是一个关键的挑战。在此,我们推出了 TransBrain,这是一个计算框架,能够实现人类和小鼠大脑整体表型的双向转换。TransBrain 通过以下方式提高了人类与小鼠同源性映射的准确性:(1)一个基于皮质和皮质下分离区域的特定深度神经网络,该网络基于整合的多模态人类转录组学进行训练,以改善皮质对应关系(比原始转录组提高了 89.5%),揭示了 2 个进化上保守的梯度;(2)一种基于图的方法来构建一个统一的跨物种表征空间

2026-01-07 08:57:25 818

原创 代谢组数据分析(三十二):多组学[代谢组]数据整合的微生物与宿主互作网络构建及可视化分析

本教程通过详细的步骤和方法,展示了如何整合微生物群落数据、宿主基因表达数据和代谢组数据,构建微生物与宿主互作网络,并进行可视化分析。这种方法为研究微生物与宿主之间的复杂关系提供了一种有力的工具,有助于推动相关疾病的研究和治疗。然而,在实际应用中,需要注意数据处理和分析过程中的各种问题,并结合实验验证来提高研究结果的可靠性和科学性。

2026-01-07 08:51:43 269

原创 【数据分析】R语言深入探索生物传感器数据的可视化与异质性分析

我们通过一系列数据分析步骤,深入探讨了生物传感器数据的可视化和异质性分析。通过对实验数据的预处理、可视化处理和异质性分析,我们揭示了生物传感器在不同条件下的响应模式,并评估了数据的可重复性。这些分析结果为我们理解生物传感器在复杂生物环境中的动态行为提供了重要的线索。

2026-01-02 00:45:00 313 1

原创 【数据分析】R语言基于高斯混合模型与多参数聚类的亚群识别与表征

本研究系统地表征了微生物发酵中的细胞异质性现象,建立了分析框架,并揭示了其与产物合成的关联。这些成果不仅加深了我们对微生物群体行为的理解,也为发酵工程的实际应用提供了新思路和新工具。随着单细胞技术的不断进步,类似的精细分析将成为发酵优化和合成生物学研究的标准方法,推动整个领域向更精准、更高效的方向发展。

2026-01-02 00:30:00 66

原创 【数据分析】基于R语言的聚类、时间序列及生存率分析在生物传感器数据中的应用

通过上述代码的运行,我们得到了一系列丰富的数据分析结果。这些结果不仅包括了不同实验条件下的细胞响应模式,还包括了时间序列分析、生存率分析和再生长动力学分析的结果。通过这些分析,我们能够更深入地理解生物传感器在不同实验条件下的响应特性。在聚类分析中,我们通过`mclust`包将细胞分为不同的亚群,并进一步分析了这些亚群的特征。通过时间序列分析,我们观察到了不同细胞在不同时间点的pH值变化。通过生存率分析,我们评估了不同处理条件对细胞存活的影响。通过再生长动力学分析,我们评估了不同处理条件对细胞再生长的影响

2026-01-01 00:30:00 232

原创 【数据分析】R语言多元统计方法探索生物传感器数据分析与可视化教程

通过上述代码的运行,我们得到了一系列丰富的数据分析结果。这些结果不仅包括了不同实验条件下的平均信号和标准误差,还包括了回归分析的结果和显著性检验的结果。通过这些分析,我们可以更深入地理解不同实验条件下生物传感器的响应特性。

2026-01-01 00:15:00 180

原创 【文献分享】ADMGCN:采用元学习模式的图卷积网络用于阿尔茨海默病诊断

阿尔茨海默病(AD)是一种神经退行性疾病,其特征为记忆力丧失和认知能力下降。由于图卷积网络(GCN)能够处理结构信息并融合多模态特征,因此在 AD 诊断方面已成为颇受欢迎的工具。然而,深度学习方法面临着诸多挑战,包括需要大量数据集以及对 AD 研究中标签分布的不均衡性敏感。为了解决这些限制并增强 GCN 的灵活性,我们提出了一种基于元学习范式的图卷积网络(ADMGCN)用于早期 AD 诊断。该方法通过加权和降维来提高性能、存储效率和训练效率。通过利用元学习,我们对受试者进行采样以创建众多标签均衡的任务,从而

2025-12-31 08:45:05 1101

原创 【文献分享】MetaMDA:利用微生物-代谢物-药物异质网络中的随机游走实现微生物-药物关联的可解释预测

与人类共生的微生物在生理过程和疾病发展(包括癌症)中起着关键作用。预测微生物-药物关联(MDA)能够促进药物研发和个性化医疗。然而,现有的方法无法预测那些未包含在已标注数据中的微生物或药物的关联,并且它们也无法模拟微生物与药物之间潜在的生物学机制。为了解决这些局限性,我们提出了一种新颖的计算框架,名为 MetaMDA,用于通过在微生物-代谢物-药物异构网络上进行随机游走来预测 MDA。MetaMDA 首先构建一个整合了微生物、代谢物和药物的异构图,从而能够模拟复杂的生物学相互作用。随后,应用具有定制转移概率

2025-12-31 08:43:03 1155

原创 【文献分享】PepQueryMHC:基于免疫肽组学数据实现肿瘤抗原的快速全面筛选

确定 MHC 结合肽的肿瘤特异性对于癌症免疫疗法的发展至关重要,但目前的方法在处理 II 类肽和非参考序列方面存在困难。我们推出了 PepQueryMHC 这一超快速工具,它将 MHC 结合肽序列与转录的 RNA 测序读数相结合,以实现对肿瘤抗原的高效优先排序。我们展示了其在优先排序 I 类和 II 类肿瘤抗原、确定呈递肽的细胞来源以及解决有关蛋白酶体剪接肽的流行程度的不确定性方面的灵活性。

2025-12-26 08:42:56 664

### 【生物信息学】基于R语言的STAMP图绘制:宏基因组数据分析与可视化

内容概要:本文介绍了如何使用R语言绘制STAMP图(STAMP Plot),这是一种用于宏基因组数据分析的统计图表。STAMP图能够展示不同组别间的效应大小、置信区间及统计显著性。文中详细描述了数据准备、T检验结果生成、画图数据准备以及最终图表的绘制过程。具体步骤包括加载必要的R包、导入和预处理数据、进行T检验以生成p值,并使用ggplot2库绘制STAMP图的三个主要部分:左侧的组间均值条形图、中间的组间差异检验结果图(T检验结果)和右侧的T检验p值图。最后,通过patchwork包将这三个图形拼接成一个完整的STAMP图。 适合人群:具备一定R语言编程基础,对生物信息学和宏基因组数据分析感兴趣的科研工作者。 使用场景及目标:①理解宏基因组数据分析中STAMP图的作用及其组成部分;②掌握如何用R语言实现STAMP图的绘制,包括数据预处理、统计分析和可视化。 其他说明:此文档仅限于个人自学使用,禁止商业或二次转载。文中使用的示例数据来自著名的鸢尾花数据集(iris),并且提供了详细的代码解释,帮助读者更好地理解和实践。此外,文档还提及了如何调整图表的主题和样式,以确保最终输出与STAMP软件的结果一致。

2025-04-20

### 数据科学R语言基础图形合集:科研绘图指南与实现

内容概要:本文档是关于R语言的基础图形合集,详细介绍了多种常见图形的绘制方法及其应用场景。文档首先强调了图形可视化在数据分析中的重要性,指出R语言作为统计学家为解决统计问题而开发的语言,在数据可视化方面具有显著优势。随后,文档依次讲解了散点图、直方图、箱线图、面积图、热图、相关图、折线图、韦恩图、火山图、饼图、密度曲线图、边界散点图、边缘箱图/直方图、拟合散点图、相关系数图、水平发散型文本、水平棒棒糖图、去棒棒糖图、时间序列图、堆叠面积图、分层树形图、聚类图、气泡图、小提琴图、核密度图、柱状图、连接散点图、二维密度图、条形图、雷达图、词云、平行坐标图、棒棒糖图、循环条形图、分组堆积图、矩形树图、圆圈图、系统树图、圆形图、分组线条图、面积图、面积堆积图、Streamgraph等多种图形的绘制方式,并提供了相应的代码示例。 适用人群:适用于具有一定编程基础的数据分析师、科研人员以及对R语言感兴趣的自学者。 使用场景及目标:①帮助读者理解不同类型图形的特点及适用场景;②通过实际案例和代码示例,指导读者如何利用R语言进行数据可视化;③提升读者的数据分析能力,使其能够根据具体问题选择合适的可视化工具和技术。 其他说明:本文档仅用于自学,禁止任何形式的商业或二次转载,如需引用部分内容,请联系作者获取授权。文档内容丰富详实,不仅涵盖了图形绘制的基本语法,还深入探讨了图形设计的原则和技巧,旨在帮助读者掌握R语言图形可视化的精髓。

2025-04-20

科研绘图R语言ggpubr包在数据可视化中的应用:多种图表类型与统计分析整合

内容概要:本文档介绍了R语言中的ggpubr包,该包作为ggplot2的一个扩展工具,旨在简化科研绘图过程并提供更直观的绘图方式。文档详细讲解了ggpubr包的安装方法、数据准备以及多种类型的图表绘制,包括密度图、柱状图、箱线图、小提琴图、点图、有序条形图、偏差图、棒棒糖图、散点图、气泡图、连线图和二维密度图等。特别强调了stat_compare_means函数的应用,它可以进行假设检验并将结果直接展示在图形上,极大地方便了科研人员和数据分析师的工作。 适合人群:具备一定R语言基础并希望提高科研绘图能力的研究人员、数据分析师和学生。 使用场景及目标:①学习如何利用ggpubr包快速高效地创建高质量的科研图表;②掌握不同类型图表的绘制方法及其应用场景;③理解如何通过图形直观展示数据差异及统计检验结果,提升数据分析和报告的质量。 其他说明:文档禁止商业或二次转载,仅供自学使用。在学习过程中,建议读者跟随示例代码进行实践操作,同时结合实际研究需求调整参数,以达到最佳的绘图效果。此外,文档提供了多种图表组合的方式,如边沿图、混合图表等高级技巧,帮助用户创建更加复杂和美观的可视化作品。

2025-04-20

科研绘图基于ggplot2的箱线图绘制:带有出现率百分比的多组别数据分布比较及可视化

内容概要:本文介绍了如何使用ggplot2包绘制带有出现率百分比的箱线图,并展示了三种不同风格的箱线图:普通ggplot2风格、prism风格以及网格状箱线图。首先,箱线图能提供数据的中位数、四分位数、异常值、最小值和最大值及偏斜性等信息,非常适合比较不同组别的数据分布。文章以鸢尾花数据集为例,详细讲解了绘制箱线图的具体步骤,包括加载R包、导入数据、处理数据并计算每个分组中Sepal.Length指标的出现率。接着,通过ggplot2的函数逐步构建箱线图,如geom_boxplot()、stat_boxplot()、geom_point()等,最后对图表进行美化,如调整坐标轴、添加文本标签、设置点大小比例尺等。此外,还介绍了如何使用ggprism包实现prism风格的箱线图,以及patternplot包创建网格状箱线图,以满足不同场景下的可视化需求。 适合人群:具备一定R语言基础,从事生物信息学或数据分析的研究人员。 使用场景及目标:①科研工作者需要展示不同组别数据分布特征时;②希望将R绘图与Prism软件中的数据可视化风格统一;③需要创建网格状箱线图来直观比较多个组别或条件下的数据分布。 阅读建议:由于涉及到较多R代码细节,在阅读过程中应结合实际操作练习,理解每个函数的作用及其参数配置,同时注意代码中的注释说明。

2025-04-20

科研绘图领域:tidyplots包替代ggplot2实现高效美观的论文图表制作

内容概要:本文介绍了R语言中的新工具——tidyplots,它是新一代的科研绘图包,旨在简化科研用图表的创建流程,提供了一套更加简洁直观且高效的语法。与传统的ggplot2相比,在生成用于科学研究和学术出版物级别的图形方面,tidyplots拥有更高的灵活性。文中不仅详细解释了如何安装此软件包(包括正式发布版本与开发者分支),而且列举了很多具体的实例来展示不同的绘图方法及其效果,如添加均值线段图、堆叠柱状图等各类高级操作,并探讨了几种常见的颜色搭配技巧。 适合人群:对于希望通过R编程快速生成高质量统计图的研究工作者来说是非常实用的内容,特别有助于那些从事自然科学领域研究并且需要频繁进行数据分析汇报的人群。 使用场景及目标:当研究人员想要利用R环境绘制精准、精美的数据分布特征图时,可以考虑采用这个强大而灵活的新款作图工具代替旧有选项。无论是在撰写期刊文章还是参与研讨会演示过程中,都能借助tidyplots构建符合行业标准的专业图表,提高成果展示的效果和说服力。 其他说明:推荐感兴趣的读者进一步访问官方提供的帮助文档,了解更多细节和技术内幕。此外还附上了几个关键链接以便于后续查阅资料以及

2025-03-25

科研绘图系列:R与Python在数据可视化中的应用及代码比较

内容概要:本文详细比较了R和Python在绘制散点图、箱线图、条形图和热图时的实现方式和代码细节。R因其强大的统计功能和丰富的图形库,在数据分析和可视化方面具有明显优势;而Python凭借其通用性和灵活的数据可视化库,同样适用于科学计算和数据可视化任务。通过具体实例展示了两种语言的各自特点,如R的ggplot2与Python的matplotlib/seaborn库的应用,并利用reticulate包实现了两者的协作,便于不同工具间的数据流动。 适合人群:对数据可视化感兴趣的科研人员、学生以及数据科学家;有一定编程基础并希望深入了解R和Python绘图能力的专业人士。 使用场景及目标:用于科学研究和技术报告中的图表制作;学习不同编程语言的数据可视化技术和最佳实践;探索如何结合R和Python的优势进行高效的数据展示。 其他说明:文中附有详细的代码片段及其解释,有助于读者理解和实践两种语言的具体用法;注意本文禁止商业二次修改,仅限个人自学使用,确保尊重作者权利的同时保障资料的质量与权威性。

2025-03-25

【科研绘图系列】R语言绘制SCI论文图合集

【科研绘图系列】R语言绘制SCI论文图合集 R语言绘制SCI论文,提供完整的数据和代码,方便大家学习

2025-02-19

在R语言中,安装R包是数据分析过程中不可或缺的一部分 当你需要执行特定的统计测试、可视化或其他任务时,你可能会发现相应的功能已经被封装在一个或多个R包中

在R语言中,安装R包是数据分析过程中不可或缺的一部分。当你需要执行特定的统计测试、可视化或其他任务时,你可能会发现相应的功能已经被封装在一个或多个R包中。然而,对于新手或需要一次性安装多个R包的用户来说,这个过程可能会有些繁琐。为了大规模安装所需要的R包,你可以使用几种不同的方法。

2025-01-23

数据分析:随机森林random forest在二分类中的应用

数据分析:随机森林random forest在二分类中的应用

2024-11-19

科研人员如何在国内高速下载测序数据SRA

科研人员如何在国内高速下载测序数据SRA

2024-11-19

科研绘图系列:R语言绘制气泡图(bubble plot)

科研绘图系列:R语言绘制气泡图(bubble plot)

2024-11-19

数据分析:广义估计方程和混合线性模型的R和python语言实现教程

数据分析:广义估计方程和混合线性模型的R和python语言实现教程

2024-11-19

数据分析:RT-qPCR分析详解及R语言绘图结果图

数据分析:RT-qPCR分析详解及R语言绘图结果图

2024-11-19

数据分析:R语言详解方差分析ANOVA的计算步骤

数据分析:R语言详解方差分析ANOVA的计算步骤

2024-11-19

科研绘图系列:R语言ggheatmapper热图实操教程

科研绘图系列:R语言ggheatmapper热图实操教程

2024-11-19

科研绘图系列:Python语言绘制SCI论文图表案例

科研绘图系列:Python语言绘制SCI论文图表案例

2024-11-19

文献分享:MongolianHCC文章提供了基因组分析的代码

文献分享:MongolianHCC文章提供了基因组分析的代码

2024-11-19

数据分析:转录组差异分析总结(DESeq2+limma+edgeR+t-test/wilcox-test

本文要点由以下几点构成: 1. 下载以及导入测试数据(批量安装R包); 2. 基因表达count矩阵的标准化方法(F(R)PKM/TPM); 3. 基因整体水平分布(PCA/tSNE/UMAP;heatmap); 4. *DESeq2*差异分析实现以及结果解析; 5. *limma*差异分析实现以及结果解析; 6. *edgeR*差异分析实现以及结果解析; 7. 结合*t-test*或*wilcox-rank-sum-test*方法的差异分析实现以及结果解析(是否符合正态分布选择检验方法); 8. 不同方法的结果比较(volcano plot+heatmap+venn); 9. 总结。

2024-11-19

数据分析:基因突变瀑布图统计以及可视化

数据分析:基因突变瀑布图统计以及可视化

2024-11-19

科研绘图系列:R语言雨云图展示更多数据分布信息

雨云图(Raincloud Plot)是一种结合了箱线图(Boxplot)、抖动图(Jitter Plot)和核密度估计(Kernel Density Estimation, KDE)或小提琴图(Violin Plot)的复合图形,用于多角度展示数据的分布特征,特别是组间数据的分布和差异。在R语言中,我们可以使用ggplot2包和gghalves包等来实现雨云图的绘制。

2024-11-18

科研绘图系列:箱线图加百分比点图展示组间差异

在展示组组间差异的时候,可以选择箱线图(boxplot),但同时也可以加上圆圈暂时指标在组间的出现率,从而在一张图上展示了多种信息。本文旨在通过R代码实现上述的可视化结果图。

2024-11-16

使用ggplot2桑基图画图

R语言的ggplot2画桑基图,包含数据和完整代码,方便大家学习

2024-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除