使用感知器算法完成对墨迹的分类

汪程序猿

已于 2022-07-14 20:15:03 修改

阅读量640

点赞数 2

分类专栏：机器学习文章标签： python sklearn 开发语言

于 2022-03-16 09:00:00 首次发布

本文链接：https://blog.csdn.net/m0_61504367/article/details/123465967

版权

机器学习专栏收录该内容

13 篇文章 6 订阅

订阅专栏

人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站
https://www.captainai.net/shuai

问题描述

平面上有两摊墨渍，它们的颜色分别是黄色和蓝色，墨渍分类问题就是是根据点的坐标，判断其染上的颜色。

从Sklearn的数据库中获取墨渍数据，每条数据是平面上的一个点，

特征组（即特征向量）为该点的坐标，标签为该点的颜色，0表示黄色，1表示蓝色。

实验目的

使用感知器算法完成对墨迹的分类。

实验内容

3.1数据导入

3.2数据预处理

plt.plot(X[:, 0][y == 1], X[:, 1][y == 1], "bs", ms=3) # 正例蓝色点
plt.plot(X[:, 0][y == 0], X[:, 1][y == 0], "yo", ms=3) # 负例黄色点
# 展示获得的数据
plt.show()
y = 2 * y - 1 # 标签 -1或+1

将数据展示出来，正例为蓝色点，负例为黄色点。

为什么要y = 2 * y -1？

这是为了将y标签转化为-1或1。当y=1时，y = 2*1-1=1；当y=0时，y=2*0-1=-1。所以，在后面的应表示：

plt.plot(X_train[:, 0][y_train == -1], X_train[:, 1][y_train == -1] - 0.1, "yo", ms=3)

3.3算法描述

感知器模型包含多个输入节点：X0-Xn，权重矩阵W0-Wn，一个输出节点O。

输入训练样本X和初始权重向量W，将其进行向量的点乘，然后将点乘求和结果如果小于等于0，来调整初始化权重向量W。如此反复，直到W调整到合适的结果为止。进而求出W，b。

在几何意义上，就是这个直线是在旋转，一直旋转到一个合适的位置。

import numpy as np

# 感知器算法
class Perceptron:
    def fit(self, X, y):
        m, n = X.shape
        w = np.zeros((n,1))
        b = 0
        done = False
        while not done:
            done = True
            for i in range(m):
                x = X[i].reshape(1,-1)
                if y[i] * (x.dot(w) + b) <= 0:
                    w = w + y[i] * x.T
                    b = b + y[i]
                    done = False
        self.w = w
        self.b = b

    def predict(self, X):
        return np.sign(X.dot(self.w) + self.b)

3.4主要代码

ink.py

# 墨渍数据从Sklearn获取
from sklearn.datasets.samples_generator import make_blobs
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from perceptron import Perceptron #导入感知器类

# 生成墨迹，图1
plt.figure(1)
# 读取m个墨渍数据
X, y = make_blobs(n_samples=100, centers=2, n_features=2, cluster_std=0.6, random_state=0)
# n_samples -在集群中平均分配的总点数。
# n_features—每个示例的特性数量。
# centers -(默认值=3)生成的中心数量，或固定的中心位置。
# cluster_std -集群的标准偏差。
# center_box—当随机生成中心时，每个集群中心的边界框。
# random_state -如果是int, random_state是随机数生成器使用的种子;如果RandomState为实例，random_state为随机数生成器;如果为None，则随机数生成器是' np.random '使用的RandomState实例。
plt.plot(X[:, 0][y == 1], X[:, 1][y == 1], "bs", ms=3) # 正例蓝色点
plt.plot(X[:, 0][y == 0], X[:, 1][y == 0], "yo", ms=3) # 负例黄色点
# 展示
plt.show()

y = 2 * y - 1 # 标签 -1或+1
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=5) # 训练集、测试集划分

model = Perceptron() # 声明Perceptron实例
model.fit(X_train, y_train) # 训练
w = model.w # model 的参数 w
b = model.b # model 的参数 b
# 输出w 和 b
print('w=', w)
print('b=', b)

# 生成训练数据
x0 = np.linspace(-1, 5, 200) # 在[-1,5]均匀取200个点
line = -w[0] / w[1] * x0 - b / w[1] # 分离线已知w,b，x0，求x1, w0x0+w1x1+b=0 , x1即line

# draw 对训练数据集进行分类，两类分离线，图二
plt.figure(2)
plt.plot(X_train[:, 0][y_train == 1], X_train[:, 1][y_train == 1] + 0.1, "bs", ms=3) # 正例蓝色点
plt.plot(X_train[:, 0][y_train == -1], X_train[:, 1][y_train == -1] - 0.1, "yo", ms=3)# 负例黄色点
plt.plot(x0, line)
plt.show()

# draw 对测试数据集进行分类，两类分离线，图三
plt.figure(3)
plt.plot(X_test[:, 0][y_test == 1], X_test[:, 1][y_test == 1], "bs", ms=3) # 正例蓝色点
plt.plot(X_test[:, 0][y_test == -1], X_test[:, 1][y_test == -1], "yo", ms=3) # 负例黄色点
plt.plot(x0, line)
plt.show()

y_pred = model.predict(X_test) # 测试
accuracy = accuracy_score(y_test, y_pred) # 测试结果的评价 sklearn.metrics.accuracy_score
print("accuracy= {}".format(accuracy))

perceptron.py

import numpy as np

# 感知器算法
class Perceptron:
    def fit(self, X, y):
        m, n = X.shape
        w = np.zeros((n,1)) 
        b = 0
        done = False
        while not done:
            done = True
            for i in range(m):
                x = X[i].reshape(1,-1)
                if y[i] * (x.dot(w) + b) <= 0:
                    w = w + y[i] * x.T
                    b = b + y[i]
                    done = False  
        self.w = w
        self.b = b
    
    def predict(self, X):
        return np.sign(X.dot(self.w) + self.b)

实验结果及分析

如果训练集太大，那么根据测试集的评估结果不够准确；如果测试集过大，那么训练集与总体样本差别太大，不一定能反应总体的特征。

遇到的问题和解决方法

问题一：出现报错

图5-1报错

这里需要改变python的版本，python3.9会出现这样的错，改成python3.6就行了。

图5-2修改版本

问题二：对感知器的算法认识不深刻。

1.感知器算法原理

感知器算法通过对已知类别的训练样本集的学习，寻找一个满足上式的权向量。

2.算法步骤

（1）选择N个分属于和类的模式样本构成训练样本集{ X1, …, XN }构成增广向量形式，并进行规范化处理。任取权向量初始值W(1)，开始迭代。迭代次数k=1。

（3）分析分类结果：只要有一个错误的分类，即不满足，则回到（2），直至对所有样本正确分类。

　　感知器算法是一种赏罚过程，这是算法的核心：

　　　　分类正确时，对权向量“赏”——这里用“不罚”，即权向量不变；

　　　　分类错误时，对权向量“罚”——对其修改，向正确的方向转换。

实现的代码：

#感知机算法
import numpy as np
import matplotlib.pyplot as plt

X0 = np.array([[1,0], [0,1], [2,0], [2,2], [1.5,-2]])
X1 = np.array([[-1,-1],[-1,0], [-2,-1],[0,-2],[0,-3]])

#将样本数据化为增广向量矩阵
ones = -np.ones((X0.shape[0],1))
X0 = np.hstack((ones,X0))
ones = -np.ones((X1.shape[0],1))
X1 = np.hstack((ones,X1))

#对样本进行规范化处理
X = np.vstack((-X0,X1))
plt.grid()
plt.scatter(X0[:,1],X0[:,2],c = 'r',marker='o',s=500)
plt.scatter(X1[:,1],X1[:,2],c = 'g',marker='*',s=500)
W = np.ones((X.shape[1],1))

flag = True
while(flag):
    flag = False
    for i in range(len(X)):
        x = X[i,:].reshape(-1,1)
        if np.dot(W.T,x)<=0:
            W = W + x
            flag = True
p1=[-2.0,2.0]
p2=[(W[0]+2*W[1])/W[2],(W[0]-2*W[1])/W[2]]
plt.plot(p1,p2)
plt.show()

图5-3运行截图

如果感觉麻烦也可下载，感谢支持：

下载地址：https://download.csdn.net/download/m0_61504367/84717279

汪程序猿

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
使用感知器算法完成对墨迹的分类

目录3.1数据导入3.2数据预处理3.3算法描述3.4主要代码问题描述平面上有两摊墨渍，它们的颜色分别是黄色和蓝色，墨渍分类问题就是是根据点的坐标，判断其染上的颜色。从Sklearn的数据库中获取墨渍数据，每条数据是平面上的一个点，特征组（即特征向量）为该点的坐标，标签为该点的颜色，0表示黄色，1表示蓝色。实验目的使用感知器算法完成对墨迹的分类。实验内容3.1数据导入 # 墨渍数据从Sklearn获取from sklearn.datase...
复制链接

扫一扫