机器学习
文章平均质量分 67
拾一滴清水
编你所思,程你所想。
展开
-
【机器学习】如何计算解释模型的SHAP值
总的来说,这个算法就是在模拟一个实验:如果我们改变一个人的年龄(而其他特征保持不变),那么这将如何影响我们的预测结果。通过多次模拟这个实验并取平均,就可以得到一个对“年龄”特征的影响力的估计值,也就是SHAP值。我们想知道“年龄”这个特征对预测结果的影响有多大,也就是我们想要计算“年龄”的SHAP值。简而言之,此算法的目的是估计在随机排列特征的情况下,特征j的存在与否对模型预测结果的影响,从而评估特征。最后,将100次迭代中计算出的所有边际贡献进行平均,得到的就是“年龄”特征的SHAP值。原创 2024-03-27 22:49:22 · 973 阅读 · 0 评论 -
深入推导理解sample softmax loss
查看TensorFlow关于nce loss和sample softmax loss时,发现都会对logit进行修正。为了搞清楚为什么需要对logit修正,以及为什么可以这样修正,参考许多资料后,现总结成文,以飨诸君。原创 2023-09-28 16:36:57 · 305 阅读 · 0 评论 -
【sklearn】回归模型常规建模流程
基于数十种统计类型特征,构建回归模型pipeline:样本切分、特征预处理、模型训练、模型评估、特征重要性的可视化。原创 2023-08-05 19:34:37 · 626 阅读 · 0 评论