LogisticRegression分类鸢尾花数据集

最新推荐文章于 2024-07-24 23:51:07 发布

love1005lin

最新推荐文章于 2024-07-24 23:51:07 发布

阅读量547

点赞数

分类专栏：机器学习文章标签：数据挖掘机器学习算法

本文链接：https://blog.csdn.net/love1005lin/article/details/109337002

版权

机器学习专栏收录该内容

21 篇文章 1 订阅

订阅专栏

LogisticRegression分类鸢尾花数据集

#logistics回归对鸢尾花数据集分类
import sklearn.datasets as datasets
from sklearn.model_selection import train_test_split

# 导入鸢尾花数据集
iris = datasets.load_iris()
iris

X = iris['data']

y = iris['target']

#划分训练集和测试集   测试集占20%
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2)

#使用逻辑回归算法
lg=LogisticRegression()

#训练
lg.fit(X_train,y_train)
#预测
y_=lg.predict(X_test)

display(y_test,y_)

评分：

lg.score(X_test,y_test)

评分：0.9333333333333333（美进行了一次实验评分值有可能会改变波动大）

系数矩阵：

lg.coef_

array([[-0.40409474, 0.97395767, -2.4559066 , -1.05140255],
[ 0.34160286, -0.08061674, -0.15599122, -0.78519003],
[ 0.06249189, -0.89334093, 2.61189781, 1.83659257]])

逻辑回归可以进行多分类问题，但核心原理还是二分类问题，所以分成三类最终会得到三个决策方程，即系数矩阵为上边的矩阵。