数据挖掘
文章平均质量分 91
细卷子
这个作者很懒,什么都没留下…
展开
-
机器学习可解释性【随机森林规则提取】
本文首先介绍了机器学习模型可解释性分为:1. 事前可解释性建模2. 事后可解释性分析随机森林规则提取,既可做事前也可做事后分析。本文主要针对事后可解释性分析,提出了先通过参数优化建立随机森林模型,然后提取规则集,再将规则集去重,通过误差、频率、长度来筛选规则集。原创 2022-05-14 16:17:48 · 3447 阅读 · 11 评论 -
pytorch手写数字识别【源码实现-小清新版】
pytorch手写数字识别,干货-清晰原创 2021-12-17 16:12:37 · 4372 阅读 · 2 评论 -
不平衡数据-SMOTE综述【SMOTE合成采样系列】
引言在机器学习中,使用常用算法进行分类时,如:逻辑回归、决策树、支持向量机、随机森林等,都假设数据集是平衡的,即:不同类别的数据在数量和质量上都是同等的。然而,真实世界中大多数数据并不满足该要求,如:银行信用系统中,不守信用的客户是少数;又如:疾病诊断系统中,诊断为阳性的也是少数。倘若直接使用不平衡数据集并使用常用算法构建模型进行分类,结果是不理想的。因此,解决不平衡数据带来的分类问题成了机器学习中的热点问题。其常用解决方法大致可以分为三类:(1)特征选择法;(2)数据分布调整;(3)模型训.原创 2021-08-23 13:43:04 · 3058 阅读 · 0 评论