自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 数据库纳排中勘误相关代码

我们在数据库的清洗中,很容易出现分类变量是字符串形式未编码、同一个样本的不同时期的随访作为新的一行、大量空值存在的情况,所以笔者在清洗代码的最后加上了几个小代码用于及时发现并查询错误的所在位置,以便进行处理。常用的merge函数简便易行,但是缺点是只允许最多合并两个数据集,以及如果两个数据集除了匹配列以外,如果存在其他相同的列,则会被被动分开而不是合并,并且列名结尾加上.x或者.y。笔者最近在完成工作的最后一部分,也就是对数据库进行整理、分析和合并,完成了这个阶段,这项工作基本告一段落。

2025-09-23 17:27:40 134

原创 队列研究中介分析

现在在考虑从新的方向解决问题,之前没有注意到常用的中介分析函数mediate不能直接把cox回归的model往上放,需要重新修改。

2025-09-03 19:38:17 131

原创 格式化输出cox回归的结果

利用这个函数,就可以直接输出HR值和95%CI的置信区间,但是缺点在于是在画图和函数包帮助窗口输出的,还需要复制到excel中进行二次的真理,但是相对于原始结果已经轻松许多。然后第二个方法就是写一个函数,强行将coxph输出的原始结果整理成我们所需要的格式。在完成了前期的数据清洗和整理工作之后,就可以根据数据的类型选择合适的输出方案了。在这里分别用两种方式格式化coxph()输出的结果。两种方法各有优缺点,可以根据自己的需求选择使用。来获得结果,希望可以得到评论区大佬的指点。完成这个函数后,再利用。

2025-07-26 21:26:00 240

原创 R中删除某一列中的缺失行

在数据的筛选量较大的时候,想要查看某一列中为数不多的非空值,可以采用complete.case函数。利用df[,]表达时,逗号前是行,逗号后是列。

2025-07-24 16:34:03 84

原创 R中UKB安装包的整理

所以转而查询到了更新后的包ukbwranglr。(没有的devtools记得先下载)然后就可以使用啦(✧◡✧)!

2025-07-22 19:53:49 489

原创 博客摘录「 R实战 | 限制性立方样条(RCS)」2025年7月9日

大多数研究者推荐的节点为3-5个。

2025-07-09 20:36:30 128

原创 数据库引用

大型数据库在管理时有时可能中间存在分隔符,而在导入到R studio中的时候很有可能就会导致导入失败,所以需要符号标明这是一段连续的字符。同时,这行代码是为了提取第一列的xxxx-xx-xx日期中的年份。加入的符号是英文输入法下数字键左侧的`

2025-06-25 20:20:56 129

原创 R语言中logistic回归

可以进一步对结果进行整理,或许95%置信区间,并用bound保留需要的小数位数,同时整理数据输出的格式,以提高容错率。这样,在outcome中输出的就是符合一般sci论文要求格式的结果了。fit可以输出原始的结果,fit2可以输出转换后的结果。在完成前期对数据的清洗工作后,开始对数据进行分析。

2025-06-22 18:25:55 192

原创 在R中提取数据框中连续特定列

这次是关于提取大型数据库中某几列代码的,既不位于最前面也不位于最后面,还必须保留EID,所以有这个代码。要提取的是第一列和第102至129列的数据,所以先提取了第1列至第129列的数据后删去中间的就解决啦。最近清洗UKB数据库整理了一些简单方便的小代码,先堆上来,等攒攒了总结一个整体的。笔者并非统计专业,恳请各位大佬指点!

2025-06-13 16:36:31 198

原创 在R中模糊查询表头

大型的数据库比如UK Bio bank 等,通常会有一个样本量和变量都极大的rds文件来提取变量,而即使是在官网找到了自己需要的变量,可能也犹豫英国生物银行数据库的列名不仅仅有变量名,还包含了随访批次等编码,所以在R中写了一行代码,得以简单迅速的随机匹配出所需要的变量。这里的‘sleep’是希望模糊查找的对象,Lifestyle_and_environment是变量名。通过这样一行简单的代码就可以在rds文件中迅速定位变量位于哪一列了。笔者并非统计专业,恳请各位专业大佬指教。

2025-06-10 21:34:06 334

原创 关于解决Linux虚拟机无法粘贴主机的内容

下拉找到 # Allow members of group sudo to execute any command,按i键转为编辑模式,在 %sudo ALL=(ALL:ALL) ALL 下面添加用户名+ALL=(ALL:ALL) ALL,wq!初学虚拟机,博主此前也完全没有接触过Linux虚拟机,在多放了解之后,最终决定安装debian,但是在安装系统过程中,发现无法将主机上的内容粘贴到虚拟机上,在多方查询之后转换思路,搜索“共享剪贴板”后解决了这个问题。安装open-vm-tools-desktop。

2025-01-07 11:14:58 1695

原创 ArcMap技巧与坐标系

第二个可能会出现的问题是由于在添加数据时两个数据包的坐标系投影不同而导致的不兼容的问题,这个时候仍然需要首先导入作为底图的图层,再将其调整为WGS_1984_World-Mercation。接着处理带有数据的图层,点击添加数据,在导入数据之后发现其单位对应不正确,需要首先定义这个图层的坐标系,根据数据我们确定正确的单位应该是度,所以定义投影的时候选择的坐标系是WGS-1984。会产生地图被压扁的原因是坐标系选择错误会导致显示的并非是最常见的平面图形而是直接覆盖在地球表面的地形。如图就是修改过后的结果。

2023-07-15 21:38:09 2761 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除