首先收集前人的智慧:
https://blog.csdn.net/sun_shengyun/article/details/53811483
个人总结一下:
1、设置L1或L2正则化是用penalty参数;
2、solver设置是损失函数的优化方法有四种‘newton-cg’, ‘lbfgs’, ‘liblinear’, ‘sag’,其中坐标轴下降法liblinear对应L1(因为要求不可导),L2对应这四种,而随机梯度下降sag在数据量特别大的时候用;
3、multi_class参数设置‘ovr’一对多,还是‘multinomial’多对多;
4、class_weight设置的是各种类型的权重,‘banlanced’表示自动计算,而dict类型可以自己设定,或者不用;
5、sample_weight设置样本权重,用来解决样本不平衡问题。
https://blog.csdn.net/ustbclearwang/article/details/81235892
我认为还有一些其他的参数需要强调一下:
tol:公差停止条件(1e-4)
C:float 默认:1.0 正则化强度, 与支持向量机一样,较小的值指定更强的正则化。
fit_intercept: bool 默认:True 指定是否应将常量(a.k.a. bias或intercept)添加到决策函数中。
n_jobs:默认1
random_state:int,RandomState实例或None;随机种子;在求解器=='sag'或'liblinear'时使用。