api | 参数 | 意义 | 备注 |
LogisticRegression parameters
| penalty | 用于指定惩罚项中使用的规范 | str类型,可选参数为l1和l2,默认为l2 |
dual | 对偶或原始方法 | bool类型,默认为False。只用在求解线性多核(liblinear)的L2惩罚项上 | |
tol | 停止求解的标准 | float类型,默认为1e-4 | |
c | 正则化系数λ的倒数 | float类型,默认为1.0 | |
fit_intercept | 是否存在截距或偏差 | bool类型,默认为True | |
intercept_scaling | 仅在正则化项为”liblinear”,且fit_intercept设置为True时有用 | float类型,默认为1 | |
class_weight | 用于标示分类模型中各种类型的权重 | 可以是一个字典或者’balanced’字符串,默认为不输入,也就是不考虑权重,即为None | |
random_state | 随机数种子 | int类型,可选参数,默认为无,仅在正则化优化算法为sag,liblinear时有用 | |
solver | 优化算法选择参数,决定了我们对逻辑回归损失函数的优化方法 | 有五个可选参数,即newtoncg,lbfgs,liblinear,sag,saga 对于小型数据集来说,‘liblinear’是一个不错的选择,而‘sag’和‘saga’对于大型数据集则更快。 对于多类问题,只有有“newtoncg”、“sag”、“saga”和“lbfgs”处理多项损失;“liblinear”仅限于one-versus-rest方案。 ‘newton-cg’, ‘lbfgs’ and ‘sag’只处理L2处罚,而‘liblinear’和‘saga’处理L1处罚。 | |
max_iter | 算法收敛最大迭代次数 | int类型,默认为10,仅在正则化优化算法为newton-cg, sag和lbfgs才有用 | |
multi_class | 分类方式选择参数 | str类型,可选参数为ovr和multinomial,默认为ovr | |
verbose | 日志冗长度 | int类型。默认为0 | |
warm_start | 热启动参数 | bool类型。默认为False。如果为True,则下一次训练是以追加树的形式进行(重新使用上一次的调用作为初始化) | |
n_jobs | 并行数 | int类型,默认为1。1的时候,用CPU的一个内核运行程序,2的时候,用CPU的2个内核运行程序。为-1的时候,用所有CPU的内核运行程序 |