sklearn机器学习——day05

最新推荐文章于 2024-07-25 16:11:31 发布

非畅6 1

最新推荐文章于 2024-07-25 16:11:31 发布

阅读量273

点赞数

文章标签：机器学习 sklearn 逻辑回归

本文链接：https://blog.csdn.net/weixin_44267765/article/details/126821054

版权

逻辑回归

本质是由线性回归变化而来的，一种广泛使用于分类问题中的广义回归算法

逻辑回归Sigmoid函数方程：

其数学目的是求解能够让模型对数据拟合程度最高的参数的值，以此构建预测函数，然后将特征矩阵输入预测函数来计算出逻辑回归的结果y

正则化：重要参数penalty & C

正则化是用来防止模型过拟合的过程，常用的有L1正则化和L2正则化两种选项，分别通过在损失函数后加上参数向量的L1范式和L2范式的倍数来实现

逻辑回归的特征工程

业务选择

PCA和SVD一般不用

统计方法可以使用，但不是非常必要

高效的嵌入法embedded

from sklearn.linear_model import LogisticRegression as LR
from sklearn.datasets import load_breast_cancer
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import cross_val_score
from sklearn.feature_selection import SelectFromModel

data = load_breast_cancer()
data.data.shape
LR_ = LR(solver="liblinear",C=0.9,random_state=420)
cross_val_score(LR_,data.data,data.target,cv=10).mean()
X_embedded = SelectFromModel(LR_,norm_order=1).fit_transform(data.data,data.target)
X_embedded.shape
cross_val_score(LR_,X_embedded,data.target,cv=10).mean()