机器学习(3)-感知机的理解与代码实现

最新推荐文章于 2024-07-28 15:46:11 发布

新名字的故事

最新推荐文章于 2024-07-28 15:46:11 发布

阅读量285

点赞数 1

分类专栏：机器学习文章标签： python 机器学习算法人工智能

本文链接：https://blog.csdn.net/sabrinalx/article/details/105886642

版权

机器学习专栏收录该内容

10 篇文章 3 订阅

订阅专栏

记录自己学习《统计学习方法》的过程，包括自己对基本概念的理解和代码实现

感知机

我的理解
代码实现

我的理解

和其他方法一样，从三个方面去认识感知机（1）模型（2）策略（3）算法
模型：首先假设输入数据是线性可分的，感知机的最终目的是求解一个超平面，使得输入可以分布在超平面的两边，从而达到分类的目的，因此感知机是一个线性的二分类模型，用数学表达式可以表示为：
$f(x)=sign(w\cdot x+b)$
这里的 $w 和 x$ 都是 $n$ 维列向量， $n$ 是输入特征维度， $x$ 是输入特征向量， $w$ 是权重， $b$ 为偏置， $s i g n$ 为符号函数
$\begin{cases} +1&&{\geq0}\\ -1&&{else} \end{cases}$
策略：感知机的优化策略是经验风险函数最小化，什么是经验风险函数呢？定义所有误分类点到超平面的距离之后为经验风险函数，最理想的情况是没有误分类点，这时经验风险函数达到最小。经验风险函数即损失函数，数学表达式定义如下：
$L(w,b)=-\sum_{x_i\in M}y_i(w\cdot x_i + b)$
$M$ 是误分类集合，此时 $y_i$ 和 $(w\cdot x_i + b)$ 符号相反，前面乘上一个符号表示距离，这里用的是函数间隔，区别于SVM中用到的几何间隔
算法：有了优化函数，接下来就是如何求解最优参数，使得经验风险函数达到最下，这里采用随机梯度下降的方法，每次随机选取一个误分类点，利用该点得到的梯度对参数进行更新，更新方式为： $\theta:=\theta-\eta\nabla_\theta l(\theta)$ , $\eta$ 为学习率，对上述损失函数求导可得：
$\frac{\partial L(w,b)}{\partial w}=-\sum_{x_i\in M}y_ix_i\\ \frac{\partial L(w,b)}{\partial b}=-\sum_{x_i \in M}y_i$
因为每次只随机选取一个误分类点对梯度进行更新，带入可得到 $w 和 b$ 的梯度更新公式：
$w:=w+\eta y_ix_i\\ b:=b+y_i$
不断选取误分类点对梯度更新，直到所有点都正确分类

代码实现

主要放一下如何训练模型即梯度更新的代码，完整的代码，后续有时间我会把机器学习一系列的代码整理一下放在GitHub上，敬请期待

def train(self):
		start = time.time()
		sampleNum, featureNum = self.data.shape
		data = np.concatenate((self.data, np.ones((sampleNum, 1))), axis=-1)
		label = self.label
		label[label>=5] = 1
		label[label<5] = -1
		#because cannot promise sample totally linear separable，set maxiter to stop training
		for i in range(self.maxiter):
			#every step choose one sample to update weight
			for j in range(sampleNum):
				if label[j] * sum((data[j] * self.weight)) <= 0:
					self.weight += self.lr * label[j] * data[j] #update weight
		print('training data spend {}s'.format(time.time() - start))

如有错误欢迎指正~

新名字的故事

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习(3)-感知机的理解与代码实现

记录自己学习《统计学习方法》的过程，包括自己对基本概念的理解和代码实现感知机我的理解代码实现我的理解和其他方法一样，从三个方面去认识感知机（1）模型（2）策略（3）算法模型：首先假设输入数据是线性可分的，感知机的最终目的是求解一个超平面，使得输入可以分布在超平面的两边，从而达到分类的目的，因此感知机是一个线性的二分类模型，用数学表达式可以表示为：f(x)=sign(w⋅x+b)f(x)=...
复制链接

扫一扫