- 博客(137)
- 资源 (2)
- 收藏
- 关注
原创 [CHNS]缺失补充方法
吸烟、饮酒、等问卷也可以将, Idind 和 Wave 排序后,进行补充…因为有多个调查Wave, 借助其他调查年的情况,特别是有多次调查的,
2025-04-19 08:36:25
167
原创 【CHNS】pexam_pub_12.sas7bdat 最重要的文件有的变量
U: 1-2、5-6、9-10=城市3、4、7、8、11-12=次级/农村:1、5、9=总人口2、4、6、8、10-12=农村。U: 1-2=城市编号/R:1-4=县编号。过去12个月:胸部有吹口哨/喘息吗?1=城市场地(U)2=农村场地(R)首次诊断为中风或脑缺血发作的年龄?16岁以下:孩子有肌肉/神经缺陷吗。胸口有口哨声/喘息声,多少年了?曾经受伤或失去至少两周的工作吗?你几岁的时候认识的。酒:梁(50克)每周喝一杯。LYR:喝软/含糖水果饮料。16岁以上:有毛囊角化病吗。16岁以下:孩子有方头吗?
2025-04-17 14:36:24
660
原创 【CHNS】感知压力Perceived Stress
PSS的总分是通过将阳性项目的得分反转,然后在所有项目上求和而获得的,得分越高,表示感知到的压力越高。
2025-04-12 10:21:33
146
原创 【孟德尔随机化】1400代谢组学分类
这1099种代谢物包括与脂质代谢(n=548,49.9%)、氨基酸代谢(n=215,19.6%)、外源性物质代谢(n=163,14.8%)、肽代谢(n=42,3.8%)、核苷酸代谢(n=42,3.8%)、辅因子和维生素代谢(n=38,3.5%)、碳水化合物代谢相关的9类生化小分子(n=25,2.3%)、部分表征分子(n=16,1.5%)和能量(n=10,0.9%)(补充数据1)。
2025-04-08 16:49:02
419
原创 【统计方法】LASSO筛变量
标准化数据:LASSO 对特征的尺度敏感,需对数据进行标准化(均值为0,方差为1)。cv.glmnet获得的lambda.min 或者 lambda.1se 传递给。比较原始做LASSO包是。
2025-04-04 22:53:37
574
原创 [mlr3] Bootstrap与交叉验证k-fold cross validation
实际应用中,可结合两者优势:用交叉验证调参,再用Bootstrap评估模型参数的置信区间。因有放回抽样的重复性和验证集的不稳定性,主要服务于。因其无放回分层抽样和重复验证机制,成为。参数估计(置信区间的计算)
2025-03-29 09:06:42
283
原创 mlr3机器学习bench置信区间AUC
p1=autoplot(bmr, type = “roc”) # 去掉置信区间p1$data 是聚合的结果,可以单个CV的作图结果在合并在一起画类似上面的 df_p_x_cv_rf不会改变已设置超参数的学习器ROC曲线禁止平滑化,如果要得到平滑的AUC/ROC曲线,采用CV策略,repeats=5 fold= 5,把结果提取出来,重新导入作图,获取aggregate可以直接获取的AUC 和95CI,靠自己rr$score(msr(“classif.auc”)) 提取计算, 可以算置信区间。Rmis
2024-12-20 21:25:44
362
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人