lasso回归_生存分析之lasso回归代码

本文介绍lasso回归在生存分析中的应用,提供相关代码,并简单解析结果。通过列%Dev展示了模型的解释能力,高比例表示模型表现优秀。后续将详细解读图表。
摘要由CSDN通过智能技术生成
54b87750edefbc40d1101f75823245f1.gif 点击上方“小梦游仙境” 带你去看小星星 1a2679c94fc953b17c8ed468b6551e49.png

代码来自老大github:https://github.com/jmzeng1314/tcga_example中的step05-lasso

这篇仅仅是代码,图片的解析后面学习过再继续记录呢~

e9d1525b4ee81651f3f06353dd0c2354.gif获得生存资料和表达矩阵数据
rm(list=ls())
options(stringsAsFactors = F)

Rdata_dir='../Rdata/'
Figure_dir='../figures/'
# 加载上一步从RTCGA.miRNASeq包里面提取miRNA表达矩阵和对应的样本临床信息。
load( file = 
        file.path(Rdata_dir,'TCGA-KIRC-miRNA-example.Rdata')
)
dim(expr)
dim(meta)
# 可以看到是 537个病人,但是有593个样本,每个样本有 552个miRNA信息。
# 当然,这个数据集可以下载原始测序数据进行重新比对,可以拿到更多的miRNA信息

# 这里需要解析TCGA数据库的ID规律,来判断样本归类问题。
group_list=ifelse(as.numeric(substr(colnames(expr),14,15)) 10,'tumor','normal')

table(group_list)
exprSe
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
生存分析是一种研究生存时间和相关因素之间关系的统计方法。在生存分析中,LASSO(Least Absolute Shrinkage and Selection Operator)回归是一种常用的机器学习方法,它可以帮助我们筛选出最相关和有预测能力的变量来预测生存时间。 LASSO回归是基于Cox比例风险模型的一种变种,它通过加入惩罚项来限制模型中的变量数量。在LASSO回归中,我们的目标是最小化残差平方和与惩罚项之和。这个惩罚项由模型中所有变量的绝对值之和乘上一个超参数来控制,当超参数增大时,惩罚作用增强,对变量的惩罚更加严厉。相比传统的回归方法,LASSO回归可以通过将某些系数收缩为零来筛选出对生存时间影响较小的变量,从而提高模型的预测准确性和解释性。 LASSO回归生存分析中的应用可以帮助我们从大量的生存分析变量中筛选出对生存时间有重要影响的变量,并建立一个简化的预测模型。通过剔除不相关的变量,LASSO回归可以减少模型的复杂性,提高模型的解释性。此外,LASSO回归还可以帮助我们发现一些可能存在的潜在关联因素,并帮助研究人员深入理解生存时间与其他因素之间的关系。 总而言之,生存分析LASSO回归是一种通过对模型中的变量进行惩罚来筛选出重要变量的方法。它在生存分析中具有重要的应用价值,可以帮助我们建立简化的生存时间预测模型,并深入理解生存时间与其他因素之间的关系。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值