逻辑回归--LogisticRegression类

linear_model.LogisticRegression(penalty='l2', *, dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='lbfgs', max_iter=100, multi_class='auto', verbose=0, warm_start=False, n_jobs=None, l1_ratio=None)

参数

penalty(重要)

正则处罚项

可选值描述
‘none’:不使用正则化
‘l2’L2正则化
‘l1’L2正则化
‘elasticnet’同时使用L1/L2正则化

tol:float

默认:1e-4
对停止迭代的容忍度

模型训练过程中通过迭代进行参数更新,参数的更新保证模型的损失函数值越来越小,当两次迭代后(或者连续几次迭代)损失函数的值没有降低到一个指定的值,我们就认为参数几乎已经达到最优,这个指定的值就是tol

slover(重要)

默认值:‘lbfgs’

优化问题的使用的算法

可选值对应的penalty参数
‘newton-cg’[‘l2’, ‘none’]
‘lbfgs’[‘l2’, ‘none’]
‘liblinear’[‘l1’, ‘l2’]
‘sag’[‘l2’, ‘none’]
‘saga’[‘elasticnet’, ‘l1’, ‘l2’, ‘none’]

注意:

  1. 'lbfgs’对于小型数据集是个较好的选择,‘sag’ and ‘saga’ 对于大型数据集的优化速度更快
  2. ‘liblinear’算法不能对多分类问题进行优化,对于多分类问题只能使用其他四种算法
  3. 'sag’和’saga’优化算法只能够在样本的特征值在大约相似的数量级时快速收敛,可以使用sklearn.preprocessing模块对样本数据进行预处理

random_state:int

  1. 默认:None
  2. 当slover=‘sag’,‘saga’,‘liblinear’时,该参数用于打乱数据集

n_jobs:int

  1. 默认:None,代表使用1个内核,该参数值为-1时,将会使用全部处理器

  2. 表示并行分类时使用到的cpu内核数量

  3. 当使用‘liblinear’优化算法时,不管’multi_class’是否指定值,该参数都将会被忽略

l1_ratio:float

  1. None,值在(0,1)之间。
  2. 当l1_ratio=1时相当于penalty=‘L1’,当l1_ratio=0时相当于penalty=‘L2’
  3. 只当’penalty=‘elasticnet’'时该参数才会生效,表示正则化l1占得比例

max_iter:int

默认:100
算法优化时,对参数的更新次数(迭代次数)

属性

classes_

ndarray , (n_classes, )
分类器已知的分类标签列表

coef_

ndarray , (1, n_features) or (n_classes, n_features)
决策函数中的特征系数
当是一个二分类问题时,该参数的形状是(1,n_features)

intercept_

ndarray , (1,) or (n_classes,)

n_features_in_

int
模型训练时候使用到的特征数量

feature_names_in_

ndarray of shape (n_features_in_,)
模型训练时使用到的特征名称,仅仅当训练集中的样本含有数据类型为“str”的特征名称

n_iter_

ndarray of shape (n_classes,) or (1, )
模型训练时对于所有类的迭代次数,如果是二分类或多分类,其返回值仅仅包含一个元素。对于’‘liblinear’优化算法,只返回所有类型的迭代次数中最大的那个

类方法

decision_function(X)

对于样本x进行预测,返回预测的信心分数

数据类型
返回值ndarray , (n_samples,) or (n_samples, n_classes)

densify()

将系数矩阵转换为密集数组格式

数据类型描述
返回值self已经拟合过的估计器

sparsify()

将系数矩阵转换为稀疏数组格式

数据类型描述
返回值self已经拟合过的估计器

fit(X, y[, sample_weight])

使用给定的训练集数据x,y训练模型

数据类型描述
返回值self已经拟合过的估计器

get_params([deep])

返回估计器的参数

数据类型描述
返回值dict参数名称以及其对应值

predict(X)(重要)

对样本x进行分类

数据类型描述
参数Xarray-like of shape (n_samples, n_features)共有n_samples个样本,每个样本有n_features个特征
返回值y_pred:ndarray , (n_samples,)返回每个样本的预测标签

predict_proba(X)(重要)

估计概率

数据类型描述
参数Xarray-like of shape (n_samples, n_features)共有n_samples个样本,每个样本有n_features个特征
返回值array-like of shape (n_samples, n_classes)共有n_samples个样本,因为有n_classes个目标标签,所以该函数返回每个样本被分类为每个标签的概率

score(X, y[, sample_weight])(重要)

返回给定的测试数据及标签的平均准确度,即返回评分

参数数据类型描述
Xarray-like,(n_samples, n_features)共有n_samples个样本,每个样本有n_features个特征
Yarray-like,(n_samples,) or (n_samples, n_outputs)
sample_weightarray-like ,(n_samples,), default=None
返回值self已经拟合过的估计器

set_params(**params)

设置估计器的参数

参数数据类型描述
**paramsdict估计器参数
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

夺笋123

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值