- 博客(21)
- 收藏
- 关注
原创 如何定量评价calibration曲线:Brier 评分和slope
如果模型预测为0.7(70%的死亡可能性),并且确实死亡,则差异为0.7-1 =-0.3。如果模型预测为1(预测这个患者死亡可能性是100%),并且确实死亡,则差异为1-1 =0。预测和实际之间没有差异,预测得非常准。Brier评分是评价模型的准确性,比如说想预测一批心衰患者的死亡率,Brier指数衡量模型预测的死亡可能性和实际患者的结局之间的差异。Brier评分高于0.25表明模型的预测不太准确,可能需要改善,Brier评分越高,模型预测的准确性就越差。:根据建立的预测模型,预测患者死亡的概率。
2023-09-12 20:19:29
1919
1
原创 R markdown 的使用
总体的感觉是,R markdown更适合已经用script跑过一遍,确认没有错误的时候,撰写R结果的文本使用,不然最后的文档里面有一堆报错和反复重复修改的代码也是看着挺裂开的。先介绍一下R markdown的好处,可以将代码和结果直接导出成word,PDF或者html格式,代码的结果不需要再手动复制粘贴,比较适合用R语言撰写报告和结果生成。和一般的R script 不同, R markdown生成的结果是紧跟在代码后面的。点击R的话,就能够插入R代码了,代码写在```的中间。author: "小饼干"
2023-09-12 20:17:37
357
1
原创 R语言 数据处理和转换的应用
本身subset()这个功能跟excel的筛选功能差不多,就是选取一个数据库的子集,但是联合了 %in% 之后,就可以实现跨数据库的筛选和匹配了,功能有点类似于Excel的vlookup的功能,当然,在可视化这个方面,excel要比r语言更胜一筹。在a这个数据框中筛选出id在b数据框的数据,subset这个函数其实是取a这个数据框的子集。向data这个是数据框中中加入id这一列,其中id是值是name。在a里面筛选出包含在b里面的数据。t()这个函数,不需专门加载包。比如 a %in% b。
2023-07-27 19:12:47
321
1
原创 用统计方法给文章加分,预测模型/预测指标优劣比较 (NRI,IDI计算)
预测模型和预测指标之间优劣的比较,最常用的是AUC。但其实除了AUC,还有许多指标可以比较指标之间的优劣,今天给大家介绍NRI,IDI,让统计方法给你的文章加分。
2023-07-18 10:34:34
421
1
原创 clump的时候,报错:The query to MR-Base exceeded 300 seconds ,尝试做本地clump
报错:The query to MR-Base exceeded 300 seconds ,尝试做本地clump
2023-06-18 22:08:36
2721
11
原创 JAVA批量拆分文件,存成小的txt文件
然后运行代码,将运行后的结果粘贴到cmd里面运行,最后在G盘student的split的文件夹里就可以看到每个学生的信息单独拆分成一个txt表。//从“school”这个数据库里面读取“class”这张表里面的name,其中f表示将表“class”重命名为f。想把一个大的school文件,按照学生名拆分成一个一个的小文件,每个小文件单独存成一个txt。//读取的文件拆分到新的文件夹下面,并以学生的名字来命名txt文件。//读取MySQL指定目录下的文件。//先写一个读取学生姓名的函数。
2023-06-16 22:28:16
279
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人