R
文章平均质量分 95
FarmerJohn
Java后端工程师。
肿瘤学研究生;平时也喜欢研究算法、统计学、机器学习、深度学习、贝叶斯分析、临床数据分析、生信数据分析、Android开发。
展开
-
R语音中的并行与分段技巧
在众多编程语言中,R语言是典型的运行慢和耗内存。当数据表比较庞大(比如一个数据集达100G),而内存有限时(比如一台普通电脑内存16G),使用R语言一次读入和处理,常规做法完全不可行。即使调大虚拟内存(swap空间),使用memory.limit(Windows系统)或 ulimit -s -v(Linux系统)等操作(虚拟内存其实很慢),即使再辅之以rm()和gc()及时清理内存(个人感觉效果甚...原创 2020-02-28 12:50:37 · 1129 阅读 · 0 评论 -
R语言随手笔记
用R语言遇到的一些问题。经常看到rcs()函数,比如拟合回归时:f <- cph(S ~ rcs(age,4) + sex, x=T, y=T)。关于RCS的理解,可以参考:Restricted cubic splines另外,丁香园里有人给出这样的看法:rcs全称是restricted cubic spline 即限制立方样条函数。为什么用它呢?我们在做回归拟合数据时,经...原创 2018-11-22 22:59:47 · 15813 阅读 · 3 评论 -
R语言资源汇总
Nomogram的教程:Logistic、Cox回归之图形化呈现(R语言中绘制Nomogram)、教你用R画列线图,形象展示预测模型的结果、基于R的生存资料预测模型构建与Nomogram绘制ggplot绘图细节汇总:ggplot2中如何设置坐标轴大小等绘图细节(总结整理)生存分析的一些资料:R语言-Survival analysis(生存分析)Survival Analysi...原创 2018-12-03 12:29:59 · 5069 阅读 · 4 评论 -
生存模型的calibration需要注意的一个问题
建立一个模型后,我们常常会评价模型的区分度(discrimination)和校准度(calibration)。生存模型中,我们经常会看到使用calibration图来呈现模型的校准度。笔者近期查阅了网上许多绘制calibration图的R代码,发现很多代码忽略了time.inc参数的使用,甚至注释中提到了这个参数的重要性却仍然用错了。将愚见记录与此,若有理解错误,烦请大佬指正。发现这个问题是源...原创 2019-06-09 17:18:34 · 11987 阅读 · 40 评论