感知机算法（统计学习方法）之三

最新推荐文章于 2021-12-08 14:33:52 发布

迷人的派大星

最新推荐文章于 2021-12-08 14:33:52 发布

阅读量332

点赞数 1

分类专栏：机器学习 python 文章标签：机器学习 python

本文链接：https://blog.csdn.net/airenKKK/article/details/117568284

版权

python 同时被 2 个专栏收录

44 篇文章 0 订阅

订阅专栏

机器学习

16 篇文章 4 订阅

订阅专栏

感知机学习算法是对以下最优化问题的算法。给定一个训练数据集
$T = \{(x_1,y_1), (x_2,y_2),...,(x_N,y_N)\}$ 其中， $x_{i} \in \mathcal{X}=\mathbf{R}^{n}, \quad y_{i} \in \mathcal{Y}=\{+1,-1\}, \quad i=1,2, \cdots, N$ ，求参数 $w$ ， $b$ ，使其转化为以下损失函数极小化问题的解：
$\operatorname{minL}(w, b)=-\sum_{x_i \in M}y_i(w * x_i+b)$ 其中M为误分类点的集合。

感知机学习算法采用随机梯度下降法（不同于批量梯度下降法，每次随机选择一个误分类点使其梯度下降）

损失函数 $L (w, b)$ 的梯度定义为：
$\begin{aligned} \nabla_{w} L(w, b) &=-\sum_{x_{i} \in M} y_{i} x_{i} \\ \nabla_{b} L(w, b) &=-\sum_{x_{i} \in M} y_{i} \end{aligned} \qquad 1$ 首先初始化 $w_0$ 、 $b_0$ （可任意选取），然后随机的选择一个误分类点 $x_i,y_i)$ ，对 $w, b$ 进行更新：
$\begin{aligned}w \leftarrow w+\eta y_{i} x_{i} \\ b \leftarrow b+\eta y_{i} \end{aligned} \qquad 2$ 其中 $\eta(0\le \eta \le1)$ 表示步长，即学习率。

*注：“梯度反映的是空间变量变化趋势的最大值和方向”，梯度下降算法时的原理就是利用了梯度的定义，梯度向量从几何意义上讲，就是函数变化增加最快的地方，沿着梯度向量的方向更容易找到函数的最大值，沿着向量相反的方向，梯度减小最快，更容易找到函数最小值。因此选用了梯度的反方向去更新参数 $w, b$ 以对损失函数进行迭代，由此可以从 $1$ 式得到 $2$ 式，符号的变化是因为方向相反。

感知机算法原始形式

输入：线性可分的训练数据集 $T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \ldots,\left(x_{N}, y_{N}\right)\right\}$ ，其中 $x_{i} \in \mathcal{X}=\mathbf{R}^{n}, \quad y_{i} \in \mathcal{Y}=\{+1,-1\}, \quad i=1,2, \cdots, N$ ；学习率 $\eta(0\le \eta \le1)$ 。
输出： $w, b$ ；感知机模型 $\cdot x + b)$ 。

选取初值 $w_0,b_0$ ；
在训练集中选取数据 $x_i,y_i)$ ；
$\quad y_i(w\cdot x_i + b) \le 0$ ，有 $\begin{aligned}w \leftarrow w+\eta y_{i} x_{i} \\ b \leftarrow b+\eta y_{i} \end{aligned}$
转到步骤2中，直到训练集中没有误分类点。

算法直观解释：当一个实例点被误分类，即位于分离超平面的错误一侧时，则调整 $w, b$ 的值，使分离超平面向该误分类点的一侧移动，以减少该误分类点与超平面之间的距离，直到超平面越过该误分类点使其被正确分类。
原始形式代码实现如下（采用鸢尾花数据集）：

import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt

# 数据线性可分，二分类数据
# 此处为一元一次线性方程
class Perceptron(object):
    # 类创建对象时自动执行，进行初始化操作
    def __init__(self, data):
        self.w = np.zeros(len(data[0]) - 1, dtype=np.float32)  # 初始化权重
        self.b = 0  # 初始化截距项
        self.l_rate = 0.1  # 学习步长

    # 定义符号函数
    def sign(self, x, w, b):
        y = np.dot(x, w) + b
        return y

    # 随机梯度下降法
    def fit(self, X_train, Y_train):
        sign = True
        while sign:
            sign = False
            for d in range(len(X_train)):
                X = X_train[d]
                Y = Y_train[d]
                if Y * self.sign(X, self.w, self.b) <= 0:
                    self.w = self.w + self.l_rate * np.dot(Y, X) # 更新权重
                    self.b = self.b + self.l_rate * Y # 更新步长
                    sign = True

if __name__ == '__main__':
    # 加载鸢尾花数据集
    iris = load_iris()
    df = pd.DataFrame(iris.data, columns=iris.feature_names)
    df['label'] = iris.target

    # 列数据标注
    df.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'label']

    # 选取特征和标签
    data = np.array(df.iloc[:100, [0, 1, -1]])
    X, Y = data[:, :-1], data[:, -1]
    Y = np.array([1 if i == 1 else -1 for i in Y])  # 将label中的0标签替换为-1

    perceptron = Perceptron(data)  # 类的实例化，创建一个对象
    perceptron.fit(X, Y)  # 调用类的fit方法

    # 可视化超平面
    x = np.linspace(4, 7, 10)  # linspace返回固定间隔的数据
    y = -(perceptron.w[0] * x + perceptron.b) / perceptron.w[1]  # 误差分类点到超平面的距离
    plt.plot(x, y)

    # 可视化展示
    plt.plot(data[:50, 0], data[:50, 1], 'x', color='red', label='0')
    plt.plot(data[50:100, 0], data[50:100, 1], 'o', color='black', label='1')
    plt.xlabel('sepal length')
    plt.ylabel('sepal width')
    plt.legend()

输出如下：
在这里插入图片描述
原始形式代码实现2（采用李航统计学习课本案例）：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

class Perceptron(object):
    def __init__(self, data):
        self.w = np.zeros(len(data[0]) - 1, dtype=np.float32)  # 初始化权重数组
        self.b = 0  # 初始化截距项
        self.l_rate = 0.1  # 学习步长

    # 定义符号函数
    def sign(self, x, w, b):
        y = np.dot(x, w) + b
        return y

    # 随机梯度下降法
    def fit(self, X_train, Y_train):
        sign = True
        while sign:
            sign = False
            for d in range(len(X_train)):
                X = X_train[d]
                Y = Y_train[d]
                if Y * self.sign(X, self.w, self.b) <= 0:
                    self.w = self.w + self.l_rate * np.dot(Y, X) # 更新权重
                    self.b = self.b + self.l_rate * Y # 更新步长
                    sign = True

if __name__ == '__main__':
    data = np.array([[3,3,1],[4,3,1],[1,1,-1]])
    X, Y = data[:, :-1], data[:, -1]
    perceptron = Perceptron(data)
    perceptron.fit(X, Y)

    # 可视化超平面
    x = np.linspace(1, 4, 5)  # linspace返回固定间隔的数据
    y = -(perceptron.w[0] * x + perceptron.b) / perceptron.w[1]  # 误差分类点到超平面的距离
    plt.plot(x, y)

    # 可视化展示
    plt.plot(data[:2, 0], data[:2, 1], '+', color='red', label='good')
    plt.plot(data[2:100, 0], data[2:, 1], 'o', color='black', label='bad')
    plt.xlabel('x^(1)')
    plt.ylabel('x^(2)')
    plt.legend()

实现效果如下：
在这里插入图片描述

迷人的派大星

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
感知机算法（统计学习方法）之三

感知机学习算法是对以下最优化问题的算法。给定一个训练数据集T={(x1,y1),(x2,y2),...,(xN,yN)}T = \{(x_1,y_1), (x_2,y_2),...,(x_N,y_N)\}T={(x1,y1),(x2,y2),...,(xN,yN)}其中，xi∈X=Rn,yi∈Y={+1,−1},i=1,2,⋯ ,Nx_{i} \in \mathcal{X}=\mathbf{R}^{n}, \quad y_{i} \in \mathcal{Y}=\{+1,-1\}, \quad
复制链接

扫一扫