Sklearn.linear_model.SGDClassifier

最新推荐文章于 2022-08-04 21:31:19 发布

kakak_

最新推荐文章于 2022-08-04 21:31:19 发布

阅读量1.4k

点赞数

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/kakak_/article/details/106011577

版权

Machine Learning 专栏收录该内容

38 篇文章 2 订阅

订阅专栏

SGD主要应用在大规模稀疏数据问题上。该模块的分类器用mini-batch来做梯度下降可轻松解决：超过 $10^5$ 的训练样本、超过 $10^5$ 的features。
如果特征数量大到和样本数量差不多，或者特征数量远远大于样本数量，则选用LR或者线性核的SVM；（eg.n=10000,m=10-1000）
如果特征的数量小，样本的数量正常，则选用SVM+高斯核函数；（eg.n=1-1000,m=10-10000）
如果特征的数量小，而样本的数量很大，则需要手工添加一些特征从而变成第一种情况。

sklearn.linear_model.SGDClassifier(loss='hinge', penalty='l2', alpha=0.0001, l1_ratio=0.15, fit_intercept=True, max_iter=1000, tol=0.001, shuffle=True, verbose=0, epsilon=0.1, n_jobs=None, random_state=None, learning_rate='optimal', eta0=0.0, power_t=0.5, early_stopping=False, validation_fraction=0.1, n_iter_no_change=5, class_weight=None, warm_start=False, average=False)

loss=”hinge”: 线性SVM. (soft-margin)
loss=”modified_huber”: 带平滑的hinge loss.
loss=”log”: logistic回归
penalty=”l2”: 对coef_的L2范数罚项
penalty=”l1”: 对coef_的L1范数罚项
penalty=”elasticnet”: L2和L1的convex组合;
$1 - l1_{ratio}) * L2 + l1_{ratio} * L1$
SGD对于特征归一化feature scaling敏感

kakak_

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Sklearn.linear_model.SGDClassifier

SGD主要应用在大规模稀疏数据问题上。该模块的分类器用mini-batch来做梯度下降可轻松解决：超过10510^5105的训练样本、超过10510^5105的features。如果特征数量大到和样本数量差不多，或者特征数量远远大于样本数量，则选用LR或者线性核的SVM；（eg.n=10000,m=10-1000）如果特征的数量小，样本的数量正常，则选用SVM+高斯核函数；（eg.n=1-1000,m=10-10000）如果特征的数量小，而样本的数量很大，则需要手工添加一些特征从而变成第一种情况。.
复制链接

扫一扫

专栏目录