（九）逻辑回归多分类应用

最新推荐文章于 2024-06-28 11:06:59 发布

文龙z

最新推荐文章于 2024-06-28 11:06:59 发布

阅读量1.6k

点赞数 1

分类专栏： python数据挖掘文章标签：逻辑回归解决多分类

本文链接：https://blog.csdn.net/qq_29644709/article/details/116008125

版权

python数据挖掘专栏收录该内容

10 篇文章 0 订阅

订阅专栏

逻辑回归（Logistics Regression）属于分类算法，最适合解决二分类问题，也可以解决多分类问题，下面两个例子都是解决多分类的应用

一、鸢尾花案例

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

iris = datasets.load_iris()
X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=666)

1.1 OvR：（One vs Rest）一对剩余

将所有类别分为两类，某一类和非这一类（其它所有类别），对新样本对于这两类进行概率计算

例如：对要预测的新样本计算为A类的概率、非A类概率；计算为B类的概率、非B类的概率；

计算为C类的概率、非C类的概率......

将这个新样本分到得分最高的那一类，用二分类的思想实现了多分类

"""
可以调用sklearn中封装的OneVsRestClassifier类，调用任意二分类算法进行多分类

例如：
from sklearn.multiclass import OneVsRestClassifier
lgr1 = LogisticRegression()
ovr = OneVsRestClassifier(lgr1)
ovr.fit(X_train, y_train)
"""

lgr1 = LogisticRegression(multi_class='ovr', solver='liblinear')
lgr1.fit(X_train, y_train)
lgr1.score(X_test, y_test)

"""
训练的模型如下：
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='ovr', n_jobs=None, penalty='l2',
                   random_state=None, solver='liblinear', tol=0.0001, verbose=0,
                   warm_start=False)
"""

#  0.9473684210526315

1.2 OvO:（One vs One）一对一

对要预测的新样本进行两两类别求概率，最后投票决定

例如：对某样本求为A类别的概率，为B类别的概率；求为B类别的概率，为C类别的概率；

求为A类别的概率，为C类别的概率，然后根据在哪个类别中数量最大进行投票决定它的类别

"""
可以调用sklearn中封装的OneVsOneClassifier类，调用任意二分类算法进行多分类

例如：
from sklearn.multiclass import OneVsOneClassifier
lgr2 = LogisticRegression()
ovo = OneVsOneClassifier(lgr2)
ovo.fit(X_train, y_train)
"""

lgr2 = LogisticRegression(multi_class='multinomial', solver='newton-cg')
lgr2.fit(X_train, y_train)
lgr2.score(X_test, y_test)

"""
训练的模型如下：
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='multinomial', n_jobs=None, penalty='l2',
                   random_state=None, solver='newton-cg', tol=0.0001, verbose=0,
                   warm_start=False)
"""
# 1.0

总结：实际检验中OvO预测准确率高于OvR

二、MNIST手写数据集

import  numpy  as  np
from sklearn.datasets import fetch_openml
mnist = fetch_openml("mnist_784")

x = mnist['data']
y = mnist['target']
print(x.shape)
print(y.shape)

x_train = np.array(x[:60000], dtype=float)
y_train = np.array(y[:60000], dtype=float)
x_test = np.array(x[60000:], dtype=float)
y_test = np.array(y[60000:], dtype=float)

from sklearn.linear_model import LogisticRegression

2.1 OvR

%%time
lgr1 = LogisticRegression(multi_class='ovr', solver='liblinear')
lgr1.fit(x_train, y_train)
lgr1.score(x_test, y_test)
# 0.9176

2.2 OvO

%%time
lgr2 = LogisticRegression(multi_class='multinomial', solver='newton-cg')
lgr2.fit(x_train, y_train)
lgr2.score(x_test, y_test)
# 0.9208

文龙z

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
（九）逻辑回归多分类应用

逻辑回归（Logistics Regression）属于分类算法，最适合解决二分类问题，当然也可以解决多分类问题一、鸢尾花案例1.1 OvR：（One vs Rest）一对剩余import numpy as npfrom sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressioniris .
复制链接

扫一扫

专栏目录