LogisticRegression训练及决策边界可视化

最新推荐文章于 2024-06-10 21:52:57 发布

Bayern-Xie

最新推荐文章于 2024-06-10 21:52:57 发布

阅读量684

点赞数 1

本文链接：https://blog.csdn.net/bayern_xie/article/details/119837797

版权

逻辑回归多元分类 sklearn 数据可视化训练测试划分

关键词由CSDN通过智能技术生成

import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
import numpy as np
from sklearn.model_selection import train_test_split

# 生成四组数据，也就是要进行分类的数据有四个类别
x1 = np.random.normal(loc=5, scale=1, size=(100, 1))
x2 = np.random.normal(loc=-2, scale=1, size=(100, 1))
x3 = np.random.normal(loc=4, scale=1, size=(100, 1))
x4 = np.random.normal(loc=0, scale=1, size=(100, 1))
y1 = np.random.normal(loc=10, scale=1, size=(100, 1))
y2 = np.random.normal(loc=1, scale=1, size=(100, 1))
y3 = np.random.normal(loc=0.5, scale=1, size=(100, 1))
y4 = np.random.normal(loc=-5, scale=1, size=(100, 1))

# 对数据进行处理,x和y是两个属性(或特征),也就是决定这个样例是是什么类别是由两个属性来判断的；
# 对应iris数据：xy属性就是feature_names, 下面的target对应的就是target_names,也就是标签
c0 = np.hstack((x1, y1))
c1 = np.hstack((x2, y2))
c2 = np.hstack((x3, y3))
c3 = np.hstack((x4, y4))
c = np.vstack((c0, c1, c2, c3))
# 四个标签,分别为0,1,2,3
target_0 = np.zeros((100, 1))
target_1 = np.ones((100, 1))
target_2 = target_1  * 2
target_3 = target_1 * 3
y = np.vstack((target_0, target_1, target_2, target_3))

# 生成训练数据和测试数据
X_train, X_test, y_train, y_test = train_test_split(c, y, test_size=0.25)
model = LogisticRegression(C=1e5, solver='lbfgs', multi_class='multinomial')
model.fit(X_train, y_train)
x_min, y_min = np.min(X_train, axis=0)
x_max, y_max = np.max(X_train, axis=0)
xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500), np.linspace(y_min, y_max, 500))
# 或者用 z=model.predict(np.c_[xx.ravel(), yy.ravel()])也是可以的
z = model.predict(np.hstack((xx.ravel().reshape(-1, 1), yy.ravel().reshape(-1, 1))))

# 绘图部分,绘图时使用plt.cm.Paired可以让点的颜色和网格块的颜色相匹配
fig = plt.figure()
plt.pcolormesh(xx, yy, z.reshape(xx.shape), shading='auto', cmap=plt.cm.Paired, alpha=0.5)
# 上一条语句也可以用plt.contourf(xx, yy, z.reshape(xx.shape), cmap=plt.cm.Paired)，效果一样
plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, edgecolor='k', cmap=plt.cm.Paired)
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.xticks(())
plt.yticks(())
plt.xlabel('x values')
plt.ylabel('y values')
plt.show()

# 下面段代码显示出原始数据点的分布
plt.scatter(x1, y1, label='class 1', alpha=0.5)
plt.scatter(x2, y2, label='class 2', alpha=0.5)
plt.scatter(x3, y3, label='class 3', alpha=0.5)
plt.scatter(x4, y4, label='class 4', alpha=0.5)
plt.legend()
plt.show()

结果如下图所示：

Bayern-Xie

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
LogisticRegression训练及决策边界可视化

import matplotlib.pyplot as pltfrom sklearn.linear_model import LogisticRegressionimport numpy as npfrom sklearn.model_selection import train_test_split# 生成四组数据，也就是要进行分类的数据有四个类别x1 = np.random.normal(loc=5, scale=1, size=(100, 1))x2 = np.random.norm.
复制链接

扫一扫