DataScience:数据不均衡-数据采样的简介及其解决方法(重采样/改权重/集成学习EasyEnsemble)、常用工具包、案例应用之详细攻略
目录
T2、改权重——ML:MetaCost算法(代价敏感学习/分类任务中的不平衡数据集)的简介(调整少样本权重)、使用方法、案例应用之详细攻略
T4、集成学习——ML之EasyEnsemble:EasyEnsemble集成学习算法的简介、案例应用之详细攻略
T5、代价敏感学习—ML:MetaCost算法(代价敏感学习/分类任务中的不平衡数据集)的简介(调整少样本权重)、使用方法、案例应用之详细攻略
Py之imblearn:imblearn/imbalanced-learn库的简介、安装、使用方法之详细攻略
Py之imbalanced-ensemble:imbalanced-ensemble库的简介、安装、使用方法之详细攻略
ML之FE:对数据不均衡数据集进行数据随机抽样/数据随机采样应用案例集合(如对超大样本的数据集进行随机采样、将大量数据的txt文件另存为csv文件)
ML之DT:基于脱敏的是否患病数据集(严重不均衡)利用四种采样策略(随机过抽样、SMOTE过采样、SMOTETomek综合采样、改变样本权重)训练决策树模型实现是否欺诈二分类实现代码
ML之LoR:利用信用卡数据集(欠采样{Nearmiss/Kmeans/TomekLinks/ENN}、过采样{SMOTE/ADASYN})同时采用LoR算法(PR和ROC评估)进行是否欺诈二分类