机器学习
无念13
这个作者很懒,什么都没留下…
展开
-
机器学习算法对比1
逻辑回归 VS 决策树树模型是一个一个特征进行处理,之前线性模型是所有特征给予权重相加得到一个新的值。 LR 对数据整体结果分析优于决策树,决策树对局部结构的分析优于逻辑回归。 LR擅于分析线性关系,决策树对线性关系把握差。决策树对应非线性,很多非线性可以用线性关系近似。线性关系实现的优点:简洁,易理解,一定程度防止过拟合。 LR对极端值敏感,易受极端值影响,决策树可以避免。随机森林 ...原创 2019-04-18 15:27:27 · 162 阅读 · 0 评论 -
数据不平衡
扩大数据集,可以得到更多分布。 更改评价指标,准确率在类别不均衡中不适合(召回率,F1,ROC) 对数据重采样,对小类数据样本进行采样增加样本个数(过采样,改变分布),对大类数据样本进行采样减少样本个数(降采样,损失样本信息) 产生人工数据样本,如插值(SMOTE) 尝试其他对数据不平衡不敏感的算法,C4.5,CART,RF等 尝试修改损失函数,对模型进行惩罚。对小样本增大样本权值,降...原创 2019-04-18 15:34:12 · 194 阅读 · 0 评论