算法
soda東風
写写博记录学习成果
展开
-
一种通用的模型输出重要因子的方法
在机器学习中有些算法会通过coef_或feature_importance输出因子重要性, 但有些算法不提供因子重要性的输出, 比如bp神经网络, SVM非线性核算法等, 在此提供一种通用的输出重要因子的方法, 适用于任一支持预测结果的模型 中心思想: 通过这种对训练集变量的随机重新排序,通过指定模型进行预测, 与原预测结果进行比对; 由于混排生成的数据破坏了原数据规律, 不再适用于原算法, 因此预测表现变差, 越重要的变量混排导致更高的错误率(高错误率=高重要性); 通过遍历训练集的因子混排预测,原创 2020-09-17 11:26:29 · 496 阅读 · 0 评论 -
机器学习算法-集成学习
概念: 通过构建并结合多个模型来共同完成学习任务 目的: 通过集成, 提高多个子学习器的模型泛化能力 流程: 1. 构建多个子学习器 2. 使用某种集成策略将模型集成 3. 完成学习任务 子学习器筛选原则: 1. 每个子学习器都要有一定的准确性 2. 子学习器之间要保持相对独立性和多样性 学习策略: Bagging: 并行式集成学习 基本原理: 同时训练多个子学习器, 最后以投...原创 2020-03-27 11:20:48 · 150 阅读 · 0 评论 -
集成学习
原创 2020-01-03 16:03:16 · 80 阅读 · 0 评论