自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 小脚本(-)判断变量类型

R软件小脚本,用于判断变是连续性变量还是分类变量,并输出变量名,方便制作table1。一个函数,不要忘记source加载哦。

2024-03-31 15:12:37 173 1

原创 纵向数据分析之Landmark analysis

纵向数据分析有多种分析方法,之前讲过了混合线性效应模型,这次讨论Landmark analysis(LM),后续讨论joint model方法。学无止境,但作为应用派,我们要知道什么时候用什么方法。

2024-01-03 14:00:41 3602 2

原创 数据基础操作之长宽数据转换

我们得到pbc_counts表格,可以看到我们生成了visit_number这一列,其中每个数值代表了每个病人随访第几次。很简单,pbc数据没有具体的固定的的随访间隔,我们只能按照随访次数。现在为了适合trajeR包,我们还需要将时间time转换为宽数据,但问题是,没有固定的随访间隔,怎么办呢?下面进行长宽数据转换时,我们需要去除year列,这一列数据没有规律,几乎没有重复值,不删除的话,无法合并。下面我们主要关注胆红素,所以尝试以胆红素为核心进行数据的长宽转换。本次讲解数据的基础操作之长宽数据转换。

2023-12-24 14:20:05 453 1

原创 R软件纵向数据分析(三)非线性纵向数据

之前两篇推文,主要介绍了混合线性效应模型,因为博主是一名临床医生,所以只关注生物医学方面的纵向数据或重复测量数据的分析,在生物医学中,非线性关系广泛存在。

2023-12-08 18:36:57 1496

原创 R软件纵向数据分析概述(二)

下面正式进入纵向数据的分析,从前文我们知道时间(time)是最重要的影响因素,其次就是分组,这里分组指的性别,推而广之,如果是临床资料,分组可能是不同的研究中心,不同的药物等等。在正式进入下一站前,我们需要思考几个有意思的问题:原文:In the next sections, we are going to answer the following three main questions:时间效应:随着时间推移,平均响应轨迹的形状是什么?群体效应:不同个体群体之间的平均差异是多少?

2023-12-05 14:28:01 2255

原创 R软件纵向数据分析概述(一)

本文是对Rpubs网站的翻译和扩展,原文见链接。原文对纵向数据有一个很好的概括和解释,原文有纵向数据特点的解释和实战部分,本人仅对实战部分进行翻译和代码解释。

2023-12-04 23:01:57 2191

原创 生信文章复现学习 PMID:36898287(三)

本文仅做logistic回归分析构建的列线图部分,其余部分已经很简单,包括DCA曲线 ROC曲线 相关性棒棒糖图,已经有不少教程,而且箱式图等也不难。因此不再进一步做了。

2023-11-18 11:11:27 149 1

原创 生信文章复现学习 PMID:36898287(二)

上文复现了DEG和WGCNA之后,与原文章有出入,最后我借用sangerbox工具取交集,选出210个gene进行LASSO和SVM分析,继续筛选核心基因,其实可以使用更多的机器学习办法,如随机森林和Xgboost。LASSO回归结果和原文差别不小,我注意到原文四个基因都在那210个基因中,但是LASSO只选出了6个,其中只有2个基因和原文一致,LASSO具体参数尚不清楚。取前38个基因和LASSO取交集,只有SOCS2和FOSB和原文一致,SVM估计参数也不一样,恳请指正。

2023-11-12 15:45:29 834 12

原创 生信文章复现学习 PMID:36898287(一)

文章学习,并尽量复现文章。

2023-11-09 22:17:04 727 6

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除