使用感知器算法完成对墨迹的分类

目录

3.1数据导入

3.2数据预处理

3.3算法描述

3.4主要代码


人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站
https://www.captainai.net/shuai

问题描述

平面上有两摊墨渍,它们的颜色分别是黄色和蓝色,墨渍分类问题就是是根据点的坐标,判断其染上的颜色。

 从Sklearn的数据库中获取墨渍数据,每条数据是平面上的一个点,

 特征组(即特征向量)为该点的坐标,标签为该点的颜色,0表示黄色,1表示蓝色。

  • 实验目的

使用感知器算法完成对墨迹的分类。

  • 实验内容

3.1数据导入

# 墨渍数据从Sklearn获取
from sklearn.datasets.samples_generator import make_blobs
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from perceptron import Perceptron #导入感知器类

# 生成墨迹,图1
plt.figure(1)
# 读取m个墨渍数据
X, y = make_blobs(n_samples=100, centers=2, n_features=2, cluster_std=0.6, random_state=0)
# n_samples -在集群中平均分配的总点数。
# n_features—每个示例的特性数量。
# centers -(默认值=3)生成的中心数量,或固定的中心位置。
# cluster_std -集群的标准偏差。
# center_box—当随机生成中心时,每个集群中心的边界框。
# shuffle -洗牌样本。
# random_state -如果是int, random_state是随机数生成器使用的种子;如果RandomState为实例,random_state为随机数生成器;如果为None,则随机数生成器是' np.random '使用的RandomState实例。

3.2数据预处理

plt.plot(X[:, 0][y == 1], X[:, 1][y == 1], "bs", ms=3) # 正例蓝色点
plt.plot(X[:, 0][y == 0], X[:, 1][y == 0], "yo", ms=3) # 负例黄色点
# 展示获得的数据
plt.show()
y = 2 * y - 1  # 标签  -1或+1

将数据展示出来,正例为蓝色点,负例为黄色点。

为什么要y = 2 * y -1?

这是为了将y标签转化为-1或1。当y=1时,y = 2*1-1=1;当y=0时,y=2*0-1=-1。所以,在后面的应表示:

plt.plot(X_train[:, 0][y_train == -1], X_train[:, 1][y_train == -1] - 0.1, "yo", ms=3)

3.3算法描述

感知器模型包含多个输入节点:X0-Xn,权重矩阵W0-Wn,一个输出节点O。

输入训练样本X和初始权重向量W,将其进行向量的点乘,然后将点乘求和结果如果小于等于0,来调整初始化权重向量W。如此反复,直到W调整到合适的结果为止。进而求出W,b。

在几何意义上,就是这个直线是在旋转,一直旋转到一个合适的位置。

import numpy as np

# 感知器算法
class Perceptron:
    def fit(self, X, y):
        m, n = X.shape
        w = np.zeros((n,1))
        b = 0
        done = False
        while not done:
            done = True
            for i in range(m):
                x = X[i].reshape(1,-1)
                if y[i] * (x.dot(w) + b) <= 0:
                    w = w + y[i] * x.T
                    b = b + y[i]
                    done = False  
        self.w = w
        self.b = b
    
    def predict(self, X):
        return np.sign(X.dot(self.w) + self.b)

3.4主要代码

ink.py

# 墨渍数据从Sklearn获取
from sklearn.datasets.samples_generator import make_blobs
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from perceptron import Perceptron #导入感知器类

# 生成墨迹,图1
plt.figure(1)
# 读取m个墨渍数据
X, y = make_blobs(n_samples=100, centers=2, n_features=2, cluster_std=0.6, random_state=0)
# n_samples -在集群中平均分配的总点数。
# n_features—每个示例的特性数量。
# centers -(默认值=3)生成的中心数量,或固定的中心位置。
# cluster_std -集群的标准偏差。
# center_box—当随机生成中心时,每个集群中心的边界框。
# random_state -如果是int, random_state是随机数生成器使用的种子;如果RandomState为实例,random_state为随机数生成器;如果为None,则随机数生成器是' np.random '使用的RandomState实例。
plt.plot(X[:, 0][y == 1], X[:, 1][y == 1], "bs", ms=3) # 正例蓝色点
plt.plot(X[:, 0][y == 0], X[:, 1][y == 0], "yo", ms=3) # 负例黄色点
# 展示
plt.show()

y = 2 * y - 1  # 标签  -1或+1
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=5)  # 训练集、测试集划分

model = Perceptron()  # 声明Perceptron实例
model.fit(X_train, y_train)  # 训练
w = model.w  # model 的参数 w
b = model.b  # model 的参数 b
# 输出w 和 b
print('w=', w)
print('b=', b)

# 生成训练数据
x0 = np.linspace(-1, 5, 200)  # 在[-1,5]均匀取200个点
line = -w[0] / w[1] * x0 - b / w[1]  # 分离线 已知w,b,x0,求x1,  w0x0+w1x1+b=0 ,  x1即line

# draw 对训练数据集进行分类,两类分离线,图二
plt.figure(2)
plt.plot(X_train[:, 0][y_train == 1], X_train[:, 1][y_train == 1] + 0.1, "bs", ms=3) # 正例蓝色点
plt.plot(X_train[:, 0][y_train == -1], X_train[:, 1][y_train == -1] - 0.1, "yo", ms=3)# 负例黄色点
plt.plot(x0, line)
plt.show()

# draw 对测试数据集进行分类,两类分离线,图三
plt.figure(3)
plt.plot(X_test[:, 0][y_test == 1], X_test[:, 1][y_test == 1], "bs", ms=3)  # 正例蓝色点
plt.plot(X_test[:, 0][y_test == -1], X_test[:, 1][y_test == -1], "yo", ms=3)  # 负例黄色点
plt.plot(x0, line)
plt.show()

y_pred = model.predict(X_test)  # 测试
accuracy = accuracy_score(y_test, y_pred)  # 测试结果的评价 sklearn.metrics.accuracy_score
print("accuracy= {}".format(accuracy))

perceptron.py
import numpy as np

# 感知器算法
class Perceptron:
    def fit(self, X, y):
        m, n = X.shape
        w = np.zeros((n,1)) 
        b = 0
        done = False
        while not done:
            done = True
            for i in range(m):
                x = X[i].reshape(1,-1)
                if y[i] * (x.dot(w) + b) <= 0:
                    w = w + y[i] * x.T
                    b = b + y[i]
                    done = False  
        self.w = w
        self.b = b
    
    def predict(self, X):
        return np.sign(X.dot(self.w) + self.b)
        





  • 实验结果及分析

  

如果训练集太大,那么根据测试集的评估结果不够准确如果测试集过大,那么训练集与总体样本差别太大,不一定能反应总体的特征。

  • 遇到的问题和解决方法

问题一:出现报错

图5-1报错

这里需要改变python的版本,python3.9会出现这样的错,改成python3.6就行了。

图5-2修改版本

问题二:对感知器的算法认识不深刻。

1.感知器算法原理

感知器算法通过对已知类别的训练样本集的学习,寻找一个满足上式的权向量。

2.算法步骤

(1)选择N个分属于和类的模式样本构成训练样本集{ X1,  …, XN }构成增广向量形式,并进行规范化处理。任取权向量初始值W(1),开始迭代。迭代次数k=1。

(3)分析分类结果:只要有一个错误的分类,即不满足,则回到(2),直至对所有样本正确分类。

  感知器算法是一种赏罚过程,这是算法的核心:

    分类正确时,对权向量“赏”——这里用“不罚”,即权向量不变;

    分类错误时,对权向量“罚”——对其修改,向正确的方向转换。

实现的代码:

#感知机算法
import numpy as np
import matplotlib.pyplot as plt

X0 = np.array([[1,0], [0,1], [2,0], [2,2], [1.5,-2]])
X1 = np.array([[-1,-1],[-1,0], [-2,-1],[0,-2],[0,-3]])

#将样本数据化为增广向量矩阵
ones = -np.ones((X0.shape[0],1))
X0 = np.hstack((ones,X0))
ones = -np.ones((X1.shape[0],1))
X1 = np.hstack((ones,X1))

#对样本进行规范化处理
X = np.vstack((-X0,X1))
plt.grid()
plt.scatter(X0[:,1],X0[:,2],c = 'r',marker='o',s=500)
plt.scatter(X1[:,1],X1[:,2],c = 'g',marker='*',s=500)
W = np.ones((X.shape[1],1))

flag = True
while(flag):
    flag = False
    for i in range(len(X)):
        x = X[i,:].reshape(-1,1)
        if np.dot(W.T,x)<=0:
            W = W + x
            flag = True
p1=[-2.0,2.0]
p2=[(W[0]+2*W[1])/W[2],(W[0]-2*W[1])/W[2]]
plt.plot(p1,p2)
plt.show()

图5-3运行截图

如果感觉麻烦也可下载,感谢支持:

下载地址:https://download.csdn.net/download/m0_61504367/84717279

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

汪程序猿

就当请我吃顿饭

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值