- 博客(7)
- 收藏
- 关注
原创 Rcurl+Python selenium爬取NCBI启动子序列进行FIMO meme实战
博主查阅资料,发现大多数是下载全序列的,并不能指定序列的区域。于是博主写了一个自动下载的代码,主要使用Rcurl爬取静态网页和Python selenium爬取动态网页批量下载根据TSS指定范围的序列,整合后进行大批量FIMO分析。
2024-05-11 16:36:07 549 1
原创 预后模型模块化代码分享(4):nomogram-ROC曲线-DCA决策曲线
链接:https://pan.baidu.com/s/1HXCSOarJSSSI7qBWO_ZbEQ?绘制时间依赖的ROC曲线,分别根据nomo模型和riskScore模型的结果绘制,时间截断值由time_seq参数指定。nomogram模型分析,根据第一篇输入的time_seq参数确定分割的时间点,单位为年。欢迎评论区批评指正!
2023-08-09 16:48:00 888
原创 预后模型模块化代码分享(3):riskScore可视化
链接:https://pan.baidu.com/s/1HXCSOarJSSSI7qBWO_ZbEQ?随后将precemt转为分组的变量risk_group,并利用grid包绘制拼接的散点图和生存时间分布图。从上图可以看出,危险分数越大的样本,生存时间越短,这里以年为单位,所以一开时输入的天被转换为了年。欢迎各位读者批评指正!
2023-08-09 16:30:57 589
原创 预后模型模块化代码分享(2):Lasso-COX回归分析
随后先进行单因素cox回归分析,大致流程为单独整理出某个基因表达、生存时间和生成状态的data.frame,在进行cox回归分析,并将结果储存在unicox中,进行筛选和可视化,可得到一个单因素cox的结果及森林图。之后进行back stepwse 多变量cox分析,当多变量模型p值小于预设值p_set_muti时退出循环,每次去掉p值最大的一个基因。在第一篇中笔者介绍的数据读取和整理,这一篇中笔者将介绍Lasso-cox回归的模块化代码,
2023-08-09 16:19:02 1475
原创 预后模型模块化代码分享(1):数据读取与整理
笔者整理了一份模块化的预后模型代码,包括Lasso-COX回归分析,riskScore的计算和可视化,nomogram、ROC曲线及决策曲线的绘制,现和大家分享。
2023-08-09 15:39:46 524
原创 “grid.draw“没有适用于“c(‘gglist‘, ‘list‘)“目标对象的方法|R语言ggsave函数无法保存多图像的解决方法
该图像是有上下两幅图拼接而成,值得注意的是,如果ggsave函数未指定plot=plot1,那么最终保存的文件仅有plot1的上半部分,这是因为ggsave仅可自动识别一个图像。查看plot1对象的类型,发现是一个具有两个list的图像,运行print(plot1)时,图像可正常显示。如果有其他解决方案,欢迎在评论区讨论!
2023-08-09 12:46:27 1447
原创 生信分析(1):单变量+多变量COX分析
从TCGA上下载数据库和临床数据之后,往往需要进行COX分析,一般的分析思路是先进行单变量,在进行多变量的分析。然而,当关注的基因比较多是,手动输入就会比较麻烦。接下来介绍一种利用循环的方法,快速的对多个变量进行分析。首先是导入数据,包括基因表达counts数据和临床数据sur,autophage是我下的一个自噬基因集,可根据需要替换为其他需要分析的基因列表,以及要用到的包:setwd("D:/A1/Rdata/Autophage/胰腺癌")library("survival")library
2021-07-22 23:29:11 14482 9
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人