- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 因果推断——(一)从辛普森悖论谈起
在辛普森悖论中有一个经典的例子如下图所示,一群病人选择是否接受新型药品的治疗,从总体来看接受新型药品治疗的患者康复率低于未接受新型治疗的患者,然而将这批数据分性别进行分析的时候就会得到与之相反的结论:无论男女在接受新型药物治疗之后康复率都高于未接受治疗的患者。,就以性别和康复率的例子来看,我们无法准确的判断治愈效果是否与性别有关,因为该实验的变量是性别,该实验的样本为人,在控制变量(排除个体因素如身体、体重等)的前提下一个人不能既是男性又是女性,这就导致我们无法准确的得出因果关系。因此都是使用统计方法来。
2024-05-03 22:19:48
1404
原创 解决Xgboost预测结果不一致问题
对csv格式的数据进行特征补全,让其特征编号连续(特征名称和特征值可以随意填充)此时发现同样的数据,但存储格式不同预测出来的结果不一致。将libsvm格式数据转换为csv格式的代码。3.使用生成的libsvm格式数据训练模型。转化后的数据与libsvm数据完全一致。直接使用libsvm格式数据预测。直接转换后的csv格式数据预测。1.首先是准备复现问题的数据。填充之后,预测结果正确。
2024-05-03 16:57:14
543
空空如也
lightGBM怎么使用libsvm格式的数据
2023-06-21
MySQL (using password: YES)
2021-01-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人