解释模型
浓香鸭腿面
目前从事利用 机器学习算法 进行 玉米基因组 数据挖掘的相关工作
展开
-
LightGBM 挖掘 SNP 的注意事项
1. 决策树难以挖掘到有意义的稀有突变每次节点所选择的特征是对整体影响最大的特征,而越靠近树根时,集合内样本数量越大,越混乱,越难分离出异常值,进而也就越难选择对表型有显著影响的稀有突变。而当节点越靠近叶片时,集合内样本数量越少,在群体中 MAF 越高的 SNP 越有可能在子集中有两种基因型,从而对子集有区分能力。对于在群体中 MAF 低的 SNP 在样本数量越少的子集中越可能只有一种基因型,从而无法对子集进行区分。同时,由于子集中 SNP 的特定基因型样本数量需 >= 叶内最小样本量,所以该原创 2020-10-20 23:11:18 · 562 阅读 · 0 评论 -
文章:LIME:Why Should I Trust You?
本文结合文章 “Why Should I Trust You?” Explaining the Predictions of Any Classifier 主要阐述一下内容:LIME 算法意义LIME 算法原理LIME 算法效果原文参见:https://arxiv.org/pdf/1602.04938v1.pdf一、LIME 算法意义LIME 是解释模型的算法,目的为了解模型的预测原理。所以 LIME 算法意义即为解释模型的意义。1. 信任模型及其预测结果信任问题涉及到两个方面:1. 信原创 2020-06-02 12:09:33 · 2551 阅读 · 5 评论