机器学习之感知机（C语言描述）

zuweie

已于 2023-12-03 13:51:00 修改

阅读量134

点赞数

分类专栏：统计学习方法 C 文章标签：机器学习人工智能

于 2023-10-18 16:43:18 首次发布

本文链接：https://blog.csdn.net/weixin_39527684/article/details/133881381

版权

C 同时被 2 个专栏收录

11 篇文章 1 订阅

订阅专栏

统计学习方法

3 篇文章 0 订阅

订阅专栏

《统计学习方法系列1》

第一章统计学习方法之感知机

文章导航

《统计学习方法系列1》
- 前言
总结

前言

最近拜读了机器学习领域，经典书籍，李航老师的《统计学习方法》，深受裨益。

一、感知机是什么？

原文所述：感知机 (perceptron) 是二类分类的线性模型，其输入空间为实例的特征向量，输出为实例的类别，取 +1 与 -1 二值。感知机对应于输入空间中将实例划分成为正负两类超平面，属于判别模型。

感知机学习旨在求出能准确划分数据的超平面，为此，导入基于误分类的损失函数，利用梯度下降法对损失函数进行极小化，求得感知机模型。

个人理解，是一个不带约束的svm？

二、感知机数学模型

假设输入空间 $\subseteq R^n$ ，输出空间是 $Y =\{+1, -1\}$ ，输入 $\subsetneq X$ 表示实例的特征向量，对应于输入空间的点 $\subsetneq Y$ 。由输入空间到输出空间的函数如下：
$\cdot x + b)$
这称之为感知机。其中：
$\begin{cases}+ 1, & x \ge 0\\ -1, & x \lt 0 \end{cases}$

线性方程：

$\cdot x + b = 0$
对应于特征空间 $R^n$ 中的一个超平面 $S$ ，其中 $w$ 是超平面的法向量， $b$ 是超平面的截距，这个超平面将特征空间划分为两部分，位于两部分的点分别被分正负两类。

我们的目标是找到适合的 $w$ 与 $b$ ，使得超平面刚好可以正确划分所有的特征向量。

三、感知机的学习策略

首先输入空间 $R^n$ 中任一点 $x_0$ 到超平面 $S$ 的距离：

$\frac {1} {||w||} | w \cdot x_0 + b|$

这里的 $∣∣ w ∣∣$ 是 $w$ 的 $L_2$ 范数，也就是( $\sqrt{w_0^2 + w_1^2 + w_3^2 ...+w_n^2}$ )，其次，对于误分类点数据 $(x, y)$ 来说，

$-y_i(w_i\cdot x_i +b) \gt 0$
是成立的。因此，误分类点 $x_i$ 到超平面 $S$ 的总距离为
$-\frac{1}{||w||}y_i(w\cdot x +b)$

那么假设误分类点集合为 $M$ ，那么所有误分类点到超平面的距离和为：
$-\frac {1}{||w||} \sum_{x_i\subsetneq M} y_i(w\cdot x + b)$
不用考虑 $\frac{1}{||w||}$ ，就得到感知机的损失函数：
$\sum_{x_i \subsetneq M}y_i(w\cdot x +b)$

于是我们的目标便是最小化这个函数
$\min_{w,b}L(w,b) = -\sum_{x_i \subsetneq M} y_i(w\cdot x + b)$

四，优化函数

得到了目标函数后，我们目标要使其最小化。最小化函数最常用的便是梯度下降法。对目标函数进行求导，便得到：
$\nabla _wL(w, b) = - \sum_{x_i\subsetneq M}y_ix_i \\ \nabla _bL(w, b) = - \sum_{x_i\subsetneq M}yi$
遍历所有点，遇上被误分类的点 $x_i, y_i)$ ，即 $y_i(w\cdot x_i +b)>0$ ，使用以下公式对 $w, b$ 进行更新：

$\leftarrow w + \eta y_ix_i \\ b \leftarrow b + \eta y_i$
其中 $\eta$ 是梯度下降法中的步进系数。

五、感知机学习算法

综上所述，感知机的算法有以下几步：
1、初始化 $w_0, b_0$ ，一般将他们赋值为 0。
2、找出所有被误分的点，也就是 $y_i(w\cdot x +b) \lt 0$ 的点。
3、然后更新 $w_0, b_0$ 。
4、重复步骤 2、3 直到没有误分类的点。

六、上代码

1、感知机的模型训练。

// C式伪代码：
matrix_t* pct_train(matrix_t* data, matrix_t* label, int eta)
{
	// W_b 是 [w0, w1, w2,...wn,b] 向量。
	// 其中 w 的长度为 data 的列数。
	matrix_t* W_b = create_matrix(data->cols + 1);
	// 初始化 W_b 为零
	matrix_fill(W_b, 0.f);
	// 是否有误分类点。
	bool has_mistake = true;
	
	while(has_mistake) {
		has_mistake = false;
		for (i : data->rows) {
			int y_i = label[i];
			matrix_t* x_i = data[i];
			// x_i 往右拉宽一位，放入 1，形成新向量[x0, x1, x2, x3,...xn, 1]。
			// 此举方便 x_i 点乘 W_b 向量。
			matrix_pad_right(x_i, 1);
			
			if ( y_i X (x_i dot W_b) > 0) {
				// 遇上误分类的点
				W_b += eta X y_i X W_b;
				has_mistake = true;
				// break;
			}
		}	
	} //直到没有误分类点，退出循环。
	return W_b;
}

2、感知机推理代码

int pct_predict(matrix2_t* _X, matrix2_t* W_b)
{
	// 将输入的特征向量往右拉宽一位，放入 1
    Mat2_pad_right(_X, 1);
    // X 向量与 W_b 向量点乘得到结果。
    float predict = _X dot W_b;
    return predict > 0 ? 1 : -1;
}

源码：https://github.com/zuweie/boring-code/blob/main/src/statistical_learning/perceptron.c

总结

感知机是一个非常简单的机器学习模型，现实应用场景中几乎不会用到感知机。但作为入门级别机器学习模型，很好地从理论到实现的展示了一个机器学习模型是如何训练，以及如何根据输入的数据，进行预测与推理。

完。

zuweie

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习之感知机（C语言描述）

最近拜读了机器学习领域，经典书籍，李航老师的《统计学习方法》，深受裨益。萌生想法，把每章的内容作大白话概要，并把每章的算法以 C 语言的形式实现，跟广大读者分享。感知机是一个非常简单的机器学习模型，现实应用场景中几乎不会用到感知机。但作为入门级别机器学习模型，很好地从理论到实现的展示了一个机器学习模型是如何训练，以及如何根据输入的数据，进行预测与推理。完。
复制链接

扫一扫

专栏目录