机器学习
theITcat
这个作者很懒,什么都没留下…
展开
-
降维:特征选择与抽取
为什么降维?维度小易于训练,过拟合风险低,便于可视化,垃圾特征会误导模型。降维分为特征选择和特征抽取特征选择过滤器: 皮尔逊相关系数衡量线性关系,可以用scipy.stat函数 互信息区分非线性关系封装器: 以异或运算为例,特征和结果可能有依赖关系,但是从模型角度来说特征不能单独生效。 模型给每个特征投票,用来选择特征,可以用sklearn.feature_selection RFE函数特征抽取特征选择之后特...原创 2020-06-13 18:57:27 · 275 阅读 · 0 评论 -
分类任务性能度量指标:准确率,召回率,F1
对于2分类问题,假设数据集由正例和反例构成,那么分类结果可以分为四种情况:将正例预测为正例,即 正→ 正 将正例预测为反例,即正→ 反 将反例预测为正例,即 反→ 正 将反例预测为反例,即 反→ 反真实情况 预测结果 正例 反例 正例 TP(...原创 2019-08-11 18:51:44 · 1170 阅读 · 0 评论