LR工具:
from sklearn.linear_model.logistic import LogisticRegression
- 参数: penalty,惩罚项,正则化参数,防止过拟合,l1或l2,默认为l2 C,正则化系数λ的倒数,float类型,默认为1.0
- solver,损失函数优化方法,liblinear(默认),lbfgs, newton-cg,sag
random_state,随机数种子 max_iter,算法收敛的最大迭代次数,默认为100 - tol=0.0001 : 优化算法停止条件,迭代前后函数差小于tol则终止
- verbose=0 : 日志冗长度int:冗长度;0:不输出训练过程;1:偶尔输出;>1:对每个子模型都输出
- n_jobs=1 : 并行数,int:个数;-1:跟CPU核数一致;1:默认值
常用方法:
-
fit(X, y, sample_weight=None)
-
fit_transform(X, y=None, **fit_params)
-
predict(X),用来预测样本,也就是分类 predict_proba(X),输出分类概率。返回每种类别的概率,按照分类类别顺序给出。
-
score(X, y, sample_weight