自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(322)
  • 资源 (1)
  • 收藏
  • 关注

原创 DNA 13. SCI 文章肿瘤突变负荷计算方法(TMB)

基因组生信分析教程DNA 1. Germline Mutation Vs. Somatic Mutation 傻傻分不清楚DNA 2. SCI 文章中基因组变异分析神器之 maftoolsDNA 3. SCI 文章中基因组变异分析神器之 maftoolsDNA 4. SCI 文章中基因组的突变信号(maftools)DNA 5. 基因组变异文件VCF格式详解DNA 6. 基因组变异之绘制精美瀑布图...

2023-03-06 11:37:36 1486

原创 FigDraw 11. SCI 文章绘图之小提琴图 (ViolinPlot)

FigDraw 11. SCI 文章绘图之小提琴图 (ViolinPlot)样式最全面的小提琴图 (ViolinPlot),全网仅桓峰基因提供此教程!

2022-06-04 06:39:14 8406 1

原创 SCS 43. 单细胞数据中细胞群的纯度/异质性计算(ROGUE)

简 介单细胞RNA测序(scRNA-seq)是一种发现和注释细胞类型和状态的通用工具,但细胞亚型的确定和注释往往是主观的和任意的。通常甚至不清楚给定的群集是否均匀。在这里提出了一个基于熵的统计,ROGUE以准确地量化鉴定细胞团的纯度并证明ROGUE指标是广泛适用的,并且能够在广泛的模拟和真实数据集上对聚类纯度进行准确,敏感和稳健的评估。将这一指标应用于成纤维细胞、B细胞和大脑数据,确定了额外...

2024-07-22 15:49:28 976

原创 IF: 24+ 基于单细胞转录组分析揭示了膀胱癌中组蛋白与耐药之间的关联

这期分享一篇2024年4月发表于 Drug Resistance Updates (IF 24+)的文章,作者基于单细胞转录组分析揭示了膀胱癌中组蛋白与耐药之间的关联。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要膀胱癌 (BCa) 患者经常对铂类化疗产生耐药性,尤其是顺铂。本研究围绕 BCa 的顺铂耐药机制展开,并强调了乳酸化在驱动这一现象...

2024-07-20 18:08:40 922

原创 RNA 42. 基于转录组及转录因子库构建转录因子调控网络 (NetAct)

简 介系统生物学的一个主要问题是如何识别控制生物过程决策的核心基因调控回路。一个名为NetAct的计算平台,用于使用转录组学数据和基于文献的转录因子目标数据库构建核心转录因子调控网络。NetAct使用目标表达稳健地推断调控因子的活性,基于转录活性构建网络,并集成数学模型进行验证。我们的计算机基准测试表明,NetAct在推断转录活性和基因网络方面优于现有算法。我们演示了应用NetAct来模...

2024-07-19 13:38:50 724

原创 SCS 42. 基于单细胞转录组表型数据构建临床预测模型 (Sicssor)

简 介单细胞RNA测序(scRNA-seq)在异质组织中区分细胞类型、状态和谱系。然而,目前的单细胞数据不能直接将细胞簇与特定表型联系起来。在这里,我们提出Scissor方法,从单细胞数据中识别与给定表型相关的细胞亚群。Scissor通过首先量化每个单细胞和每个大样本之间的相似性,整合了表型相关的大样本表达数据和单细胞数据。然后,优化了与样本表型相关矩阵的回归模型,以确定相关的亚群。将Scisso...

2024-07-18 14:43:26 952

原创 IF: 16+ 6种机器学习算法利用代谢组学预测胃癌的诊断和预后

这期分享一篇2024年2月发表于 Nature Communications (IF 16+)的文章,作者基于6种机器学习算法利用代谢组学预测胃癌的诊断和预后。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要胃癌(GC)是世界范围内癌症相关死亡率的重要负担,强调迫切需要制定早期发现策略和精确的术后干预措施。然而,鉴别用于早期诊断和患者风险分层的非侵入...

2024-07-06 17:50:58 928

原创 IF: 8+ 基于10种机器学习揭示了肺腺癌预后和治疗中不同细胞死亡模式

这期分享一篇 2024年1月发表于 npj Precision Oncology (IF 8+)的文章,作者基于机器学习揭示了肺腺癌预后和治疗中不同细胞死亡模式。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘要肺癌细胞的生长、转移和耐药性对肺腺癌(LUAD)的治疗提出了重大挑战。然而,目前缺乏能够准确预测患者预后并指导选择靶向治疗的最佳预测模型。程序性细胞死...

2024-07-02 20:46:55 599

原创 IF: 12+ 基于6种机器学习算法整合单细胞和bulk转录组预测前列腺癌的进展

这期分享一篇 2024年1月发表于 Theranostics (IF 12.6)的文章,作者基于单细胞和大量转录组学的综合分析开发了一个强大的神经内分泌细胞内在特征来预测前列腺癌的进展。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要神经内分泌前列腺癌(NEPC)通常意味着严重的致命性和有限的治疗选择。NEPC细胞的精确鉴定对于研究和临床应用具有至关重...

2024-07-01 21:50:55 1490

原创 IF: 8+ 基于26种机器学习算法的人工智能预测肺腺癌患者预后和免疫治疗反应

这期分享一篇 2024年1月发表于Cell Prolif (IF 8.5)的文章,作者基于26种机器学习算法的人工智能预测肺腺癌患者预后和免疫治疗反应。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要免疫细胞在影响肺腺癌 (LUAD) 细胞的增殖、进展和转移中起着越来越重要的作用。然而,免疫细胞特异性基因模型的潜力在很大程度上仍然未知。在当前的研究中,...

2024-06-30 11:36:33 832

原创 ML 45. 机器学习之快速实现随机生存森林 (Ranger)

简 介Ranger 软件是一个快速实现高维数据的随机森林。支持集成分类、回归和生存树。用参考实现验证包,并将运行时和内存使用情况与其他实现进行比较。新软件被证明是最好的缩放与特征,样本,树的数量,并尝试分裂的特征。最后,表明 Ranger 是最快和最有效的实现随机森林在全基因组关联研究的规模上分析数据。软件包安装if(!require(ranger)) install.packages("r...

2024-06-29 16:48:02 639

原创 ML 44. 机器学习之梯度提升回归树用于生存数据 (BlackBoost)

简 介梯度提升回归树GBRT(Gradient Boosting Regression Tree)是利用树模型进行回归的算法模型。梯度提升采用连续的方式构造树,每棵树都试图纠正前一棵树的错误。默认情况下,梯度提升回归树中没有随机化,而是用到了强预剪枝。梯度提升树通常使用深度很小的数,这样模型占用内存更少,预测速度也更快。软件包安装if(!require(mboost)) install.p...

2024-06-28 15:18:12 701

原创 MachineLearning 43. 机器学习之梯度增强线性模型用于生存数据 (glmboost)

简 介glmboost (Gradient Boosting with Component-wise Linear Models) 实现了优化一般风险函数的增强,利用组件(惩罚)最小二乘估计作为基础学习器,用于将各种广义线性和广义加性模型拟合到潜在的高维数据。演示了如何使用 glmboost 来拟合不同复杂性的可解释模型。作为一个例子,在整个教程中,使用ovarian数据集。软件包安装glmb...

2024-06-27 13:52:02 922

原创 MachineLearning 42. 机器学习之Akritas条件非参数生存估计 (akritas)

简 介Akritas生存估计是更常见的Kaplan-Meier估计的条件近邻方法。常见的用法包括IPCW生存模型和度量,不需要假设删失是独立于协变量的。软件包安装survivalmodels包使用reticulate从Python实现模型。为了使用这些模型,必须按照reticulate::py_install安装所需的Python包。Survivalmodels包含一个辅助函数,用于安装所需的...

2024-06-26 13:18:31 825

原创 MachineLearning 41. 机器学习之参数生存回归模型 (survreg)

简 介失效时间数据根据生存结局的发生情况,生存分析的数据资料常常分为终点事件(如死亡)和删失(其他生存结局)两类。生存分析不同类型的数据包括:完全数据(Complete data)删失数据(Censoring data)删失数据通常在其右上角标记"+"号,表示真实的生存时间未知,只知道比观察到的删失时间要长。在生存分析中,发生终点事件记为“1” ,删失记为"0” 。删失的类型包括:(1) 右...

2024-06-25 15:01:33 603

原创 Topic 21. 临床预测模型之Surv 创建生存对象

点击关注,桓峰基因Surv 创建生存对象创建一个生存对象,通常用作模型公式中的响应变量。参数匹配对于这个函数是特殊的,请参阅下面的详细信息。Description创建一个生存对象,通常用作模型公式中的响应变量。参数匹配对于此函数来说是特殊的,请参阅下面的详细信息。UsageSurv(time, time2, event, type=c('right', 'left', 'interval...

2024-06-15 18:27:09 754

原创 MachineLearning 40. 机器学习之基于条件推理树的生存分析临床预测 (CTree)

简 介条件推理树(Conditional inference trees)。条件推断树的算法如下:(1) 对输出变量与每个预测变量间的关系计算p值。(2) 选取p值最小的变量。(3) 在因变量与被选中的变量间尝试所有可能的二元分割(通过排列检验),并选取最显著的分割。(4) 将数据集分成两群,并对每个子群重复上述步骤。(5) 重复直至所有分割都不显著或已到达最小节点为止。条件推理树与决策树有什...

2024-06-13 12:08:50 851

原创 MachineLearning 39. 机器学习之基于条件随机森林的生存分析临床预测 (CForest)

简介条件随机森林(cforest) 是一个R中用于建立随机森林(Random Forest) 模型的函数。随机森林是一种机器学习算法,通过集成多个决策树来进行预测和分类。创建一个大量决策树的模型,每个决策树都是相互独立的。最后的预测使用来自单个树的所有预测并将它们组合起来。在本文中,我们将介绍 cforest 的用法,并提供一些示例代码。软件包安装软件包安装方式:if(!require("par...

2024-06-12 12:38:36 985

原创 MachineLearning 38. 机器学习之基于最近收缩质心分类法的肿瘤亚型分类器 (pamr)

简 介基于最近收缩质心分类法(nearest shrunken centroids)的基因表达谱预测癌症类别的方法。缩小了原型,从而得到了一个通常比竞争方法更准确的分类器。“最近的收缩质心”方法确定了最能表征每个类别的基因子集。该技术是通用的,可用于许多其他分类问题。为了证明其有效性,表明该方法在寻找用于分类小圆蓝细胞肿瘤和白血病的基因方面非常有效。软件包安装软件包安装:install.p...

2024-06-06 11:51:59 724

原创 MachineLearning 37. 机器学习之倾斜随机生存森林 (obliqueRSF)

简 介斜随机生存森林(ORSF)是一种集成方法,用于右删节存活数据,它使用输入变量的线性组合递归地划分一组训练数据。正则化Cox比例风险模型用于识别每个递归划分步骤中输入变量的线性组合。模拟和真实数据的基准测试结果表明,与随机生存森林、条件推理森林、回归和增强相比,ORSF预测的风险函数具有较高的预测价值。在Jackson心脏研究数据的应用中,使用ORSF证明了变量和部分依赖性,并强调了其10年...

2024-06-04 21:28:00 980

原创 MachineLearning 36. 机器学习之基于神经网络的Cox比例风险模型 (Deepsurv)

简 介背景医疗从业者使用生存模型来探索和理解患者协变量(如临床和遗传特征)与各种治疗方案有效性之间的关系。标准的生存模型,如线性Cox比例风险模型,需要广泛的特征工程或先前的医学知识来模拟个体水平上的治疗相互作用。虽然非线性生存方法,如神经网络和生存森林,可以固有地模拟这些高级交互术语,但它们尚未被证明是有效的治疗推荐系统。方法我们引入 DeepSurv,一种 Cox 比例风险深度神经网...

2024-05-24 09:03:17 556

原创 MachineLearning 35. 机器学习之Lasso+Cox回归筛选变量 (LassoCox)

简 介对于Cox模型,响应最好是一个由生存包中的Surv()函数创建的Surv对象。对于右删减的数据,该对象的类型应该是“right”,对于(start, stop)数据,它的类型应该是“counting”。为了拟合分层Cox模型,在将响应传递给glmnet()之前,应通过stratifySurv()函数将地层添加到响应中。(为了向后兼容,右审查的数据也可以作为两列矩阵传递,列名为'tim...

2024-05-22 09:48:27 1411

原创 SEQ 2. 生信工具之GFF和GTF互相转换 (gffread)

简 介GTF(基因转移格式)和GFF(通用特征格式)是生物信息学程序常用的文件格式,用于表示和交换有关各种基因组特征的信息,如基因和转录本的位置和结构。GffRead是开源程序,提供了广泛和有效的解决方案来操作GTF或GFF格式的文件。虽然GffRead可以转换、排序、过滤、转换或聚类基因组功能。许多生物医学研究应用采用管道系统地分析基因组中的基因内容。由于转录组学数据的爆炸式增长...

2024-05-14 17:07:03 1928

原创 MachineLearning 34. 机器学习之竞争风险生存分析的深度学习方法(DeepHit)

简 介生存分析(time-to-event analysis)广泛应用于经济金融、工程、医学等诸多领域。一个基本问题是理解协变量和生存时间(时间到事件)分布之间的关系。之前的大部分工作都是通过将生存时间视为随机过程的第一次命中时间来解决这个问题,假设潜在随机过程的特定形式,使用可用数据来学习协变量与模型参数之间的关系,然后推导协变量与第一次命中时间(风险)分布之间的关系。然而,以前的模型依赖于...

2024-04-25 10:20:20 1051

原创 MachineLearning 33. 机器学习之时间-事件预测与神经网络和Cox回归

简 介利用神经网络对Cox比例风险模型进行扩展,提出了时间-事件预测的新方法。基于嵌套病例对照研究的方法,我们提出了一个损失函数,可以很好地扩展到大型数据集,并可以拟合Cox模型的比例和非比例扩展。通过仿真研究,验证了所提出的损失函数是Cox部分对数似然的良好近似。将提出的方法与现有方法在实际数据集上进行比较,发现具有很强的竞争力,通常在Brier分数和二项对数似然方面产生最佳性能。软件包安装...

2024-04-18 10:21:05 538

原创 IF: 10+ 基于10种人工智能确定预后指数揭示高危骨肉瘤的代谢易感性

这期分享一篇 2024年1月发表于 Clin Transl Med (IF 10.6)的文章,作者基于人工智能衍生的预后指数确定角鲨烯环氧化酶在高危骨肉瘤中的代谢易感性。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要背景: 骨肉瘤(OSA)是一个临床难题,其5年生存率较低。目前,缺乏先进的分层模型使得个性化治疗变得困难。本研究旨在寻找新的...

2024-04-17 09:38:52 877

原创 SEQ 1. 测序的前世今生

最近这几天正好看来一些测序的比对算法,顺便看了测序的原理,从最初的 Sanger 到现在 Nanopore 和 Pacbio,觉得时代更替的真快,变化的措不及防,于是决定增加一个关于测序时代变迁的话题,与行业内外人士共同见证测序的40年。这期分享将帮助大家挑选最适合自己研究工作,临床或诊断应用的测序平台。简 介新一代测序方法已经被开发并提出用于研究基因组学或涉及 DNA 的临床应用。这...

2024-04-12 09:19:14 917

原创 IF: 10+ 基于深度学习整合bulk转录组和单细胞转录组揭示肝细胞癌的预后和治疗选择中的焦亡特征...

‍‍这期分享一篇 2024年1月发表于 Briefings in Bioinformatics (IF 9.5)的文章,作者基于深度学习整合bulk转录组和单细胞转录组揭示肝细胞癌的预后和治疗选择中的焦亡特征。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要虽然已经报道了一些与焦热相关 (PR) 的癌症预后模型,但在肝细胞癌 (HCC) 的单细胞水平上...

2024-04-08 10:01:45 1208

原创 SCS【41】基于贝叶斯反卷积法整合分析bulk和scRNA-seq (BayesPrism)

‍‍简 介BayesPrism 使用从匹配或相似组织类型收集的scRNA-seq样本,对大量RNA-seq(和空间转录组学)进行细胞类型和基因表达反褶积。将scRNA-seq作为先验信息,估计P(θ,Z|X,ϕ),即细胞类型分数θ和细胞类型特异性基因表达Z在每个群体中的联合后验分布,条件是参考ϕ和每个观察群体X。软件包安装library("devtools");install_github("D...

2024-04-07 16:22:14 1051

原创 Drug 2. 临床标志物之药物敏感性水平 (oncoPredict)

上期我们介绍了临床标志物之药物-基因关联预测,这期继续介绍药物敏感性水平的计算。临床前生物标志物发现这个脚本提供了一个如何在临床前生物标志物发现中控制一般药物敏感性水平 general levels of drug sensitivity (GLDS)的例子。具体来说,这个脚本对GDSCv2数据应用glds函数来获得每个#drug-gene关联的p值和beta值。控制GLDS很重要,因为GLDS的...

2024-04-03 11:28:40 1419

原创 Drug 1. 临床标志物之药物-基因关联预测 (oncoPredict)

简 介细胞系药物筛选数据集可用于一系列不同的药物发现应用,从药物生物标志物发现到建立药物反应的翻译模型。之前,我们描述了三种独立的方法:(1) 纠正药物敏感性的一般水平,以实现药物特异性生物标志物的发现;(2) 预测患者的临床药物反应;(3) 将这些预测与临床特征联系起来,以进行体内药物生物标志物的发现。在这里,我们联合并将这些方法更新到一个R包(oncoPredict)中,以促进这些工...

2024-04-02 16:39:41 1409

原创 MachineLearning 32. 机器学习之支持向量机递归特征消除的特征筛选 (mSVM-RFE)

简 介本文提出了一种新的特征选择方法,该方法使用类似于支持向量机递归特征消除 (SVM-RFE)的反向消除过程。与 SVM-RFE 方法不同的是,在每一步中,该方法通过对原始训练数据的子样本上训练的多个线性支持向量机的权重向量进行统计分析来计算特征排序得分。我们在四个用于癌症分类的基因表达数据集上测试了所提出的方法。结果表明,所提出的特征选择方法比原 SVM-RFE 方法选择了更好的基因...

2024-03-29 09:26:58 1468

原创 MachineLearning 31. 机器学习之基于RNA-seq的基因特征筛选 (GeneSelectR)

简 介RNA-seq 数据集在识别下游分析和数据挖掘工作的生物学相关特征方面提出了相当大的挑战。标准方法涉及差异基因表达 (DGE) 分析,但由于其单变量性质,其有效性可能受到数据的限制。在复杂的数据集中,另一种方法涉及使用各种机器学习 (ML) 工具,这些工具试图理解特征之间的非线性关系,并专注于概括性而不是统计显著性。这种方法将导致生成多个特征列表,这些特征列表可能在分类性能指标方...

2024-03-27 13:52:14 1377

原创 MachineLearning 30. 机器学习之特征选择森林之神 (Boruta)

简 介机器学习方法通常用于对由数百个属性描述的对象进行分类。在许多这类应用中,很大一部分属性可能与分类问题完全无关。更重要的是,通常人们不能先验地决定哪些属性是相关的。为什么变量选择很重要?删除冗余变量有助于提高准确性。同样,纳入相关变量对模型精度也有积极影响。太多的变量可能导致过拟合,这意味着模型不能泛化模式。太多的变量导致计算速度慢,反过来又需要更多的内存和硬件。R中有很多用于功能选...

2024-03-25 11:23:56 946

原创 IF: 39+ 基于单细胞转录组测序揭示肺腺癌和鳞癌之间的异质性免疫图谱

桓峰基因的教程不但教您怎么使用,还会定期分析一些相关的文章,学会教程只是基础,但是如果把分析结果整合到文章里面才是目的,觉得我们这些教程还不错,并且您按照我们的教程分析出来不错的结果发了文章记得告知我们,并在文章中感谢一下我们哦!公司英文名称:Kyoho Gene Technology (Beijing) Co.,Ltd.这期分享一篇 2022年8月发表于 Signal Transduct Tar...

2024-03-21 11:50:49 783

原创 IF: 16+ 基于弹性网络回归嵌套验证方法证实肿瘤邻近肺内炎症是肺腺癌临床预后的预测因子...

桓峰基因的教程不但教您怎么使用,还会定期分析一些相关的文章,学会教程只是基础,但是如果把分析结果整合到文章里面才是目的,觉得我们这些教程还不错,并且您按照我们的教程分析出来不错的结果发了文章记得告知我们,并在文章中感谢一下我们哦!公司英文名称:Kyoho Gene Technology (Beijing) Co.,Ltd.这期分享一篇 2023年6月发表于nature cummunications...

2024-03-20 12:05:25 265

原创 MachineLearning 29. 机器学习之嵌套交叉验证 (Nested CV)

简 介Nested CV 提供有助于在生物医学数据中开发和调整机器学习模型的功能,其中样本量通常有限,但预测因子的数量可能要大得多。虽然大多数机器学习管道涉及将数据分成训练和测试队列,通常分别为2/3和1/3,但医疗数据集可能太小,无法做到这一点,因此在遗漏的测试集中确定准确性会受到影响,因为测试集很小。嵌套交叉验证(CV)提供了一种绕过这个问题的方法,通过最大化地使用整个数...

2024-03-19 12:53:32 1130

原创 IF: 16+ 基于10种机器学习方法开发了免疫性 lncRNA signature 改善结直肠癌的预后

桓峰基因的教程不但教您怎么使用,还会定期分析一些相关的文章,学会教程只是基础,但是如果把分析结果整合到文章里面才是目的,觉得我们这些教程还不错,并且您按照我们的教程分析出来不错的结果发了文章记得告知我们,并在文章中感谢一下我们哦!公司英文名称:Kyoho Gene Technology (Beijing) Co.,Ltd.这期分享一篇2022年发表在2023年3月发表于nature cummuni...

2024-03-16 08:56:34 1067

原创 MachineLearning 28. 机器学习之偏最小二乘回归应用于生存分析 (plsRcox)

简 介偏最小二乘回归(Partial Least Squares Regression,PLS Regression)是一种常用的统计建模方法,用于解决多元线性回归中自变量间高度相关的问题。在偏最小二乘回归中,通过将原始自变量转换为一组新的综合变量(称为主成分或潜在变量),然后再使用这些主成分进行回归分析,从而减少自变量之间的共线性,并且提高模型的稳定性和预测能力。偏小二乘回归提供...

2024-03-15 09:51:07 1030

原创 MachineLearning 27. 机器学习之偏最小二乘回归应用于生存分析 (plsRcox)

简 介偏最小二乘回归(Partial Least Squares Regression,PLS Regression)是一种常用的统计建模方法,用于解决多元线性回归中自变量间高度相关的问题。在偏最小二乘回归中,通过将原始自变量转换为一组新的综合变量(称为主成分或潜在变量),然后再使用这些主成分进行回归分析,从而减少自变量之间的共线性,并且提高模型的稳定性和预测能力。偏小二乘回归提供...

2024-03-14 15:57:09 1092 1

突变命名法则资料

突变命名法则资料,作为命名规则,给予文字与图像结合的方式展现出来

2018-11-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除