机器学习与智能优化 之 排序与选择特征

要点

减少一个模型使用的输入特征同时保持性能大体一致有诸多好处:模型尺寸更小、便于人类理解、训练和运行速度更快、可能更高的泛化能力。

在不考虑特定模型方法和它们之间关系的情况下很难对独立的特征进行排序。想想一个侦探(这相当与是一个“有罪”和“清白”的分类器)只有智能地综合众多线索,排除令人迷惑的证据,才能得到正确的结论。排序和过滤只是初步的探索,还需要结合所选方法在不同特征集上去尝试验证,并用特征选择过程去包装这个方法。

简言之:仅当你猜测是线性关系的时候,才去信任相关系数。不然的话,可以使用其他的相关评价方法,例如相关率可以甚至衡量输出不是定量的情况。用卡方通过估计独立与联合事件的概率来辨明输入与输出间可能的独立性。最后,用强大的互信息来估计任意定量或定性特征间的独立性,但要注意仅提供少量样本情况下可能出现的过高估计。

作为练习,捡起你最喜欢的福尔摩斯小说,去找到他用地是哪种特征(线索,证据)选择方法去抓住和揭露一个罪犯并且让他的朋友华生点赞的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
***要性是指特征对模型预测结果的影响程度。有多种方法可以用来计算特征重要性。根据引用中的内容,以下是一些常用的特征重要性排序方法: 1. 嵌入法(Embedded methods):这是一种基于模型的方法,通过训练模型并使用模型内部的特征重要性指标来选择特征。例如,可以使用sklearn库中的SelectFromModel和mljar-supervised中的AutoML来进行特征选择排序。 2. 排列重要性(Permutation Importance):这种方法通过随机重排某个特征的值来评估该特征对模型性能的影响。可以使用PermutationImportance来计算特征的重要性。 3. SHAP值:SHAP值是一种特征归因方法,可以用来衡量每个特征对模型输出的贡献程度。引用中提到,SHAP值是唯一一致的个性化特征归因方法。 需要注意的是,不同的特征重要性计算方法可能会得到不同的结果,如引用所提到的。因此,为了更全面地评估特征的重要性,可以结合多种方法来获取特征重要性的排序。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [机器学习模型可解释性进行到底——特征重要性(四)](https://blog.csdn.net/sinat_26917383/article/details/115680807)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [【可解释性机器学习】排列重要性(Permutation Importance)及案例分析详解](https://blog.csdn.net/ARPOSPF/article/details/128774692)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值