机器学习
文章平均质量分 65
llxmly
这个作者很懒,什么都没留下…
展开
-
随机森林
本文是对随机森林的总结。random forest,gbdt,xgboost可谓kaggle比赛的三剑客,在保持优秀的bias的基础上,有效地降低了variance,表现十分优秀。随机森林属于集成学习方法,可用于分类与回归,通过训练众多决策树,输出多数类别(分类问题)或预测均值(回归问题)。随机森林纠正了单颗决策树易过拟合的缺点。原创 2017-05-23 16:52:35 · 595 阅读 · 0 评论 -
Logistic Regression
Logistic回归并不是回归,而是用于解决二分类问题。其本质是在线性回归的基础上加了一层sigmoid函数映射。它可以预测某事件在给定样本特征下发生的“概率”(判别模型,p(y|x)判别模型,p(y|x)),然后选择“概率”最大的事件作为预测结果。sigmoid函数公式 g(x)=11+e−xg(x)=\frac{1}{1+e^{-x}} 函数曲线如下图所示 sigmoid是s形曲线,取值在原创 2017-06-01 13:03:01 · 402 阅读 · 0 评论