LogisticRegression分类鸢尾花数据集
#logistics回归对鸢尾花数据集分类
import sklearn.datasets as datasets
from sklearn.model_selection import train_test_split
# 导入鸢尾花数据集
iris = datasets.load_iris()
iris
X = iris['data']
y = iris['target']
#划分训练集和测试集 测试集占20%
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2)
#使用逻辑回归算法
lg=LogisticRegression()
#训练
lg.fit(X_train,y_train)
#预测
y_=lg.predict(X_test)
display(y_test,y_)
评分:
lg.score(X_test,y_test)
评分:0.9333333333333333(美进行了一次实验评分值有可能会改变 波动大)
系数矩阵:
lg.coef_
array([[-0.40409474, 0.97395767, -2.4559066 , -1.05140255],
[ 0.34160286, -0.08061674, -0.15599122, -0.78519003],
[ 0.06249189, -0.89334093, 2.61189781, 1.83659257]])
逻辑回归可以进行多分类问题,但核心原理还是二分类问题,所以分成三类最终会得到三个决策方程,即系数矩阵为上边的矩阵。
截距
lg.intercept_
array([ 9.35726132, 2.1467135 , -11.50397482])