感知器 - 西瓜好坏自动识别——python

Vicky__3021

已于 2023-01-15 18:37:30 修改

阅读量3.2k

点赞数 10

分类专栏：模式识别文章标签： python 算法开发语言人工智能

于 2022-07-04 21:38:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51771374/article/details/125609120

版权

模式识别专栏收录该内容

8 篇文章

订阅专栏

任务描述

本关任务：使用感知机算法建立一个模型，并根据感知器算法流程对模型进行训练，得到一个能够准确对西瓜好坏进行识别的模型。

相关知识

为了完成本关任务，你需要掌握：1.什么是感知器，2.感知器算法流程。

数据介绍
西瓜数据集中的样本特征一共有 30 个，包括：色泽、根蒂、敲声等。类别为是好瓜与不是好瓜。部分数据如下：
在这里插入图片描述
由于我们的模型只能对数字进行计算。所以，我们用x1表示色泽，x2表示根蒂，x3 表示敲声。y 表示类别。其中，x1 = 0，表示青绿，x2 = 2，表示稍蜷， y=-1，表示不是好瓜。具体如下图：

而我们的任务就是，用感知器算法建立一个模型，利用训练集上的数据对模型进行训练，并对测试集上的数据进行分类。

什么是感知器
我们希望构建一个感知器模型，根据色泽、根蒂、敲声这三个特征来判断是好瓜还是坏瓜。

在这里插入图片描述
比如说，输入的特征值分别是青绿，蜷缩，浊响对应特征向量为 (0,0,0)。感知器模型会首先将样本特征值x转换为增广特征向量y，对y乘以一个对应的权值向量a，所得到的值如果大于等于 0，则判断为 +1 类别，即为好瓜，如果得到的值小于 0，则判断为 -1 类别，即不是好瓜。数学模型如下：
在这里插入图片描述
感知器算法流程
我们能否正确对西瓜好坏进行预测，完全取决于权向量的值是否正确，那么如何找到正确的参数呢？可以利用训练样本，使用梯度下降法优化感知器准则（损失函数），将权向量求解出来。
在这里插入图片描述
那么，感知器准则是怎么样的呢？
感知器准则函数是误分类点到决策边界的函数距离：

在这里插入图片描述

综上，感知机只针对误分类的点对参数进行更新，利用随机梯度下降算法，每次迭代值取一个样本，具体流程如下：

提示：

可利用np.column_stack()函数将样本转化为增广样本；
dot()函数计算向量点积。

编程要求

根据提示，在右侧编辑器中的 begin-end 之间补充 python 代码，构建一个感知机模型，底层代码会调用您实现的感知机模型进行训练，并对测试集上数据进行分类。

测试说明

程序内部会检测您的代码，预测正确率大于 0.8 则视为过关。

代码

#encoding=utf8
import numpy as np
#构建感知机算法
class Perceptron(object):
    def __init__(self, learning_rate = 0.01, max_iter = 200):
        self.lr = learning_rate
        self.max_iter = max_iter
    def fit(self, data, label):
        '''
        input:data(ndarray):训练数据特征
              label(ndarray):训练数据标签
        output:a(ndarray):训练好的权重
               b(ndarry):训练好的偏置
        '''
        #编写感知机训练方法，a为增广权向量
        # datat = np.column_stack((data,np.ones(data.shape[0]))) #将样本转化为增广样本
        self.w = np.array([1.]*data.shape[1])
        self.b = np.array([1.])
        #********* Begin *********#
        for i in range(len(label)):
            while label[i]*(np.matmul(self.w,data[i])+self.b) <= 0:
                self.w = self.w + self.lr * (label[i]*data[i])
                self.b = self.b + self.lr * label[i]
        #********* End *********#
    def predict(self, data):
        '''
        input:data(ndarray):测试数据特征
        output:predict(ndarray):预测标签
        '''
        #********* Begin *********#
        yc = np.matmul(data,self.w) + self.b
        for i in range(len(yc)):
            if yc[i] >= 0:
                yc[i] = 1
            else:
                yc[i] = -1
        predict = yc
        #********* End *********#
        return predict

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Vicky__3021 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。