感知机模型学习笔记及Python实现_python已知训练集中正实例点是x1,x2负实例点,感知机算法原始模型f(x)=sign(w x+-CSDN博客

本文链接：https://blog.csdn.net/u011098721/article/details/52204610

　　最近刚接触李航博士的《统计学习方法》，还是挺赞的一本书，特别适合机器学习初学者的入门。里面主要阐述机器学习中的几大经典模型的理论方面，包括感知机、kNN、决策树、朴素贝叶斯、逻辑回归、SVM等。下面我结合自己的理解先介绍下感知机及其学习算法，然后通过Python实现这一模型并可视化处理。

1. 感知机模型

　　感知机模型如下

f (x) = s i g n (w \cdot x + b)

$f(x)= sign(w\cdot x + b)$ 　　其中，

x $x$ 表示实例的特征向量，

w $w$ 表示权值向量，

w⋅x $w\cdot x$ 表示

w $w$ 和

x $x$ 的内积，计算公式为：

w \cdot x = w 1 \cdot x 1 + w 2 \cdot x 2 + \dots + w n \cdot x n

$w\cdot x =w_1\cdot x_1 +w_2\cdot x_2 + \ldots +w_n\cdot x_n$ 　　sign为符号函数：

s i g n (x) = {+ 1, x \geq 0 - 1, x < 0

$sign(x) = \begin{cases}+1,x \ge 0 \\ -1,x \lt0 \end{cases}$
　　上面几个公式看着比较抽象，下面从几何的角度看下什么是感知机：

　　从上图可以看到，

w⋅x+b=0 $w \cdot x +b = 0$ 对应于特征空间中的一个超平面（如果特征空间为二维空间，那么超平面为一条直线），该超平面将特征空间划分为正、负两部分。我们要学习得到的感知机模型，就是要求得其中的参数

w $w$ 和

x $x$ .

2. 学习算法（原始形式与对偶形式对比）

　　感知机学习算法是对以下最优化问题的算法. 给定一个训练数据集

T = {(x 1, y 1), (x 2, y 2), \dots, (x N, y N)}

$T = \{ (x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N) \}$ 　　其中，

xi∈χ=Rn,yi∈{−1,1},i=1,2,⋯,N $x_i \in \chi = \mathbb R^n, y_i \in \{-1,1\},i=1,2,\cdots,N$ ，求参数

w,b $w,b$ ，使其为以下损失函数极小化问题的解

m i n w, b L (w, b) = - \sum x i \in M y i (w \cdot x i + b)

$min_{w,b} L(w,b) = - \sum_{x_i \in M}y_i(w \cdot x_i + b)$ 　　其中

M $M$ 为误分类点的集合。
　　关于感知机的损失函数由来以及学习策略这里不再赘述，可以参照《统计学习方法》原著第2章节或者参考资料.
　　下面我主要从学习算法的原始形式和对偶形式两个方面的对比，来加深该算法的理解。

\	原始形式	对偶形式
输入	数据集 $T$ , 学习率 $\eta(0 \lt \eta \le 1)$ 数据集 $T$ , 学习率 $\eta(0 \lt \eta \le 1)$ 输出 $w,b;　f(x)=sign(w \cdot x_i +b)$ $\alpha,b;　f(x) = sign(\sum_{j=1}^N \alpha_iy_ix_j \cdot x_i +b)$ 误分类条件 $y_i(w \cdot x+b)\le 0$ $y_i(\sum_{j=1}^N \alpha_i y_i x_j \cdot x_i +b)\le 0$ 迭代更新 $w\leftarrow w+\eta y_i x_i;b\leftarrow b+\eta y_i$ $\alpha_i \leftarrow \alpha_i + \eta;b\leftarrow b +\eta y_i$ 　（ $\alpha，b$ 初始值为 $0$ ）
区别	由误分类点调整 $w,b$ 将 $w,b$ 表示成 $x$ 和 $y$ 的线性组合的形式，从而得到 $w,b$ 问1：如何简单地理解学习算法的对偶形式？　　通常来说，对于原始形式不好解决的问题，可以转换到对应的对偶形式中，使之更容易求解。比如，在多维空间中运算量较大，感知机学习的对偶形式能够更加简地便计算。问2：为什么在对偶形式中，迭代更新 $\alpha$ 和 $b$ 能够得到参数 $w$ 和 $b$ 呢？　　对偶形式的基本想法是，将 $w$ 和 $b$ 表示为实例 $x_i$ 和标记 $y_i$ 的线性组合的形式，通过求解其系数而求得 $w$ 和 $b$ .现在假设初始值 $w_0,b_0$ 均为 $0$ . 对误分类点 $(x_i,y_i)$ 通过 $w \leftarrow w + η y i x i$ $w \leftarrow w + \eta y_i x_i$ $b \leftarrow b + η y i$ $b \leftarrow b+\eta y_i$ 　　逐步修改 $w,b$ . 设修改了 $n$ 次，则 $w,b$ 关于 $(x_i,y_i)$ 的增量分别是 $\alpha_i y_i x_i$ 和 $\alpha_i y_i$ ,这里 $\alpha_i = n_i \eta$ . 最后学习到的 $w,b$ 可以分别表示为 $w = \sum i = 1 N n i η y i x i = \sum i = 1 N α i y i x i$ $w =\sum_{i=1}^N n_i \eta y_i x_i= \sum_{i=1}^N\alpha_i y_i x_i$ $b = \sum i = 1 N n i η y i = \sum i = 1 N α i y i$ $b = \sum_{i=1}^N n_i \eta y_i= \sum_{i=1}^N \alpha_i y_i$ 　　这里， $\alpha_i \ge 0,i=1,2,\cdots,N$ ，当 $\eta=1$ 时， $\alpha_i$ 表示第i个实例点由于误分二进行更新的次数.当某一个实例点更新的次数越多，意味着它距离分离超平面越近，也就越难分类. 换句话说，这样的实例对学习结果影响最大. 3. 算法实现　　例子：正样本点是 $x_1 = (3,3)^T, x_2 = (4,3)^T,$ 负样本点是 $x_3 = (1,1)^T,$ 试用感知机学习算法对偶形式求感知机模型. import numpy as np x = np.array([[3,3],[4,3],[1,1]])#创建数据集，共3个实例 y = np.array([1,1,-1]) #创建标签 history = [] #存储迭代学习过程中的w,b值，便于可视化绘图 gramMatrix = x.dot(x.T) #计算Gram矩阵，后面需要多次用到 print "gramMatrix = ",gramMatrix alpha = np.zeros(len(x)) #初始化alpha为零向量 b = 0 #b为回归直线截距 learnRate = 1 #初始化为0；learnRate为学习率，设为1 k = 0; i = 0 #k用来计算迭代次数；i用来判定何时退出while循环 while 1: if y[i] * (np.sum(alpha * y * gramMatrix[i])+ b)<=0: #误分条件：若某一数据点被错误分类 alpha[i] = alpha[i] + learnRate #更新 alpha 值 b = b + learnRate * y[i] #更新 b 值 i = 0 #i 赋值为0，再遍历一次所有的数据集 k = k + 1 #k + 1 即迭代次数加1 history.append([(alpha * y.T).dot(x), b]) #存储w，b print "iteration counter =",k print "alpha = ",alpha print "b = ", b continue else: #若某一数据点被正确分类 i = i + 1 print "i = ",i if i >= x.shape[0]: #退出while循环条件,即 i >= 3，所有数据点都能正确分类 print "iteration finish" break #break 退出wile循环 w = (alphay.T).dot(x) #计算得到权值 w print "w = ", w print "b = ", b print "history w,b = ",history #==========================可视化===========================# import matplotlib.pyplot as plt from matplotlib import animation fig = plt.figure() ax = plt.axes() line, = ax.plot([], [], 'g', lw=2) label = ax.text([], [], '') def init(): global x,y,line,label plt.axis([-6, 6, -6, 6]) plt.scatter(x[0:2,0],x[0:2,1],c ="r",label = "postive",s = 60) #画正样本点 plt.scatter(x[2,0],x[2,1],c = "y",label = "negtive",s =60) #画负样本点 plt.grid(True) plt.xlabel('X1') plt.ylabel('X2') plt.title('myPerceptron') return line, label #返回值为line，label对象，表示这两个对象有动画效果 def animate(i): #形参 i 表示帧数，即 animation.FuncAnimation 函数形参列表中的frames属性 global history, ax, line, label w = history[i][0] b = history[i][1] if w[1] == 0: return line, label x1 = -6.0 #点(x1,y1)和点(x2,y2)确定分类超平面 y1 = -(b + w[0] x1) / w[1] x2 = 6.0 y2 = -(b + w[0] * x2) / w[1] line.set_data([x1, x2], [y1, y2])#画出分类超平面 x1 = 0.0 y1 = -(b + w[0] * x1) / w[1] label.set_text(str( history[i][0]) + ' ' + str(b)) #在点 (0,y1) 上绘制文本便签 label.set_position([x1, y1]) return line, label anim = animation.FuncAnimation(fig, animate,init_func=init, frames=len(history), interval=1000, repeat=True,blit=True) plt.legend(fancybox = True) plt.show() #anim.save('perceptron.gif', fps=2, writer='imagemagick') #使用ImageMagick导出GIF图片实现效果： 4. 总结　　感知机是最简单最基础的分类器，理论也较简单. 但到了真正自己动手实现算法的时候，会遇到各种各样的问题. 说到底还是经验不足，以后有空还是要多推敲推敲代码. 一边实践，一边温习理论知识，理解才会更加深刻. 参考资料： http://www.hankcs.com/ml/the-perceptron.html 本文作为个人学习笔记，有什么不正确的地方，还请多多批评指正确定要放弃本次机会？福利倒计时 : : 立减 ¥ 普通VIP年卡可用立即使用夏目_ 关注关注 5 点赞踩 18 收藏觉得还不错? 一键收藏 1 评论复制链接分享到 QQ 分享到新浪微博扫一扫专栏目录 python3实现感知器 ustbbsy的博客 01-31 1584 1、感知器模型 2、更新权重主要更新w,b t为label,y是预测，t-y=偏差，下文程序中的bias,η为学习率，步长，下文程序中的rate. 3,python3代码实现 import numpy as np #定义激活函数 def acti_fun(x): return 1 if x > 0 else 0 #创建感知器类 cla 李航统计学习方法----感知机章节学习笔记以及python代码詹sir的博客 07-22 1034 感知机算法的原理以及实现 1 条评论您还未登录，请先登录后发表或查看评论感知机算法Python实现 10-30 实现了感知机的python代码，有例子有图形机器学习: 简易感知机实现最新发布 liu7418520963的博客 07-18 810 python实现感知机感知机模型实现 banzycr285163的博客 07-25 139 1、python自编程实现： import numpy as np import matplotlib.pyplot as plt class MyPerceptron: def __init__(self): self.w=None # 参数w的个数与x的特征数量对应，初始并不知道x的特征个数，故赋值None self.b=... 感知机实现Python 相国大人 03-04 836 《统计学习方法》第二章python实现：1 感知机原型的python实现1.1 损失函数：L(ω,b)=−∑xi∈Myi(ω⋅xi+b)L \left( \omega ,b \right)=- \sum_{x_i \in M}y_i\left( \omega \cdot x_i +b\right) 其中MM为误分类点的集合。1.2 原始学习算法——非对偶例2.1（采用随机梯度下降）#!/usr/ 感知机算法python实现 05-10 感知机（perceptron）是线性分类的二分类模型，感知机算法使用Python实现含数据集，输出的是测试集的类别《统计学习方法》感知机学习笔记与Python实现木百栢的博客 05-20 726 学习笔记 1.感知机模型假设输入空间（特征空间）是X⊆RnX⊆Rn\mathcal X \subseteq \mathbf R^n，输出空间是Y={+1,−1}Y={+1,−1}\mathcal Y = \{+1, -1\}。输入x∈Xx∈Xx \in \mathcal X表示示例的特征向量，对应于输如入空间的点；输出y∈Yy∈Yy \in \mathcal Y表示示例的类别。由输入空... 基于Python实现感知机PLA(人工智能实验)【100011915】 04-19 总的来说，通过这个实验，参与者不仅能了解感知机的基本概念，还能掌握如何用Python实现和应用感知机模型。此外，实验过程中遇到的问题和解决方法将加深对算法的理解，提升问题解决和编程能力。对于想要在机器学习... PyTorch深度学习实战基于多层感知机模型和随机森林模型的某地房价预测_使用感知器实现房价预测 2401_84166327的博客 05-06 671 【代码】PyTorch深度学习实战基于多层感知机模型和随机森林模型的某地房价预测_使用感知器实现房价预测。李航《统计学习方法》笔记和 Python 实现（不基于任何代数运算库）+源代码+文档说明 12-01 * 第 2 章 [感知机](./chapter_2_perceptron/) [\[感知机代码-原始形式\]](./chapter_2_perceptron/Perceptron.py) [\[感知机代码-对偶形式\]](./chapter_2_perceptron/Dual-form_Perceptron.py) * 第 3 章 [k近邻... 【感知机】—— 感知机算法原理及Python实现 seven的博客 02-27 1714 文章目录感知机（Perceptron）感知机的原始形式感知机的对偶形式Perceptron算法实现scikit-learn实现Perceptron 感知机（Perceptron）二分类模型、线性分类模型、判别模型输入：为实例的特征向量输出：实例的类别，取+1和-1 感知机的原始形式模型：寻找能够将训练数据进行线性划分的分离超平面感知机模型： f(x)=sign(w∗x... 感知机python实现 u012724887的专栏 09-16 359 看了《统计学习方法》自己实现下感知机算法： import numpy as np train = np.array([[3, 3], [4, 3], [1, 1]]) label = np.array([1, 1, -1]) omega = np.zeros(train.shape[1]) b = 0 alpha = 1 j = 0 i = 0 while(i < train.sha... 感知机Python实现 amira_von的博客 03-20 3042 感知机原始算法的Python实现和动画演示 #感知机的Python实现 u014697805的博客 10-22 334 原始形式 # coding: utf-8 # 原始感知机的学习算法 import pandas as pd import numpy as np from pandas import * import matplotlib.pyplot as plt from numpy import * x = np.array([[3, 4, 1],[3, 3, 1]]) #数据集x = x.transpose 感知机及Python实现 Jeaten 09-23 3949 本文将讲解感知机的原理以及笔者使用Python语言对其的实现：感知机原理什么叫感知机呢？在李航老师《统计学习方法》中是这么讲的：“感知机（perception）是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。” 从定义我们可以看出，感知机其实就是能够实现一个二分类问题的表达式或函数。关于二分类问题，是指问题只可以被分为两类的问题，比如人类从性... 第二章感知机的python实现小楼吹彻玉笙寒 01-24 262 @Date: 23-Jan-2018 @Email: zengsw_study@qq.com @Filename: 第二章感知机的python实现.md @Last modified time: 24-Jan-2018 @Copyright: ©2017 EndlessLethe. All rights reserved. --> 这里是我的个人网站： https://en "支持向量机学习笔记及Python实战本文是统计学习方法第七章《支持向量机》的...通过学习本文，读者可以掌握支持向量机的核心思想和应用方法，并能够利用Python代码实现支持向量机算法。因此，本文对于学习和应用支持向量机的人群具有一定的参考价值。夏目_ CSDN认证博客专家 CSDN认证企业博客码龄11年暂无认证 1 原创 78万+ 周排名 232万+ 总排名 4071 访问等级 60 积分 3 粉丝 5 获赞 1 评论 8 收藏私信关注热门文章感知机模型学习笔记及Python实现 4072 分类专栏机器学习 1篇算法 python 1篇统计学习方法 1篇最新评论感知机模型学习笔记及Python实现清汜十七: import numpy as np import matplotlib.pyplot as plt from matplotlib import animation x = np.array([[3,3],[4,3],[1,1]])#创建数据集，共3个实例 y = np.array([1,1,-1]) #创建标签 history = [] #存储迭代学习过程中的w,b值，便于可视化绘图 gramMatrix = x.dot(x.T) #计算Gram矩阵，后面需要多次用到 print("gramMatrix = ",gramMatrix) alpha = np.zeros(len(x)) #初始化alpha为零向量 b = 0 #b为回归直线截距 learnRate = 1 #初始化为0；learnRate为学习率，设为1 k = 0; i = 0 #k用来计算迭代次数；i用来判定何时退出while循环 while 1: if y[i] * (np.sum(alpha * y * gramMatrix[i])+ b)<=0: #误分条件：若某一数据点被错误分类 alpha[i] = alpha[i] + learnRate #更新 alpha 值 b = b + learnRate * y[i] #更新 b 值 i = 0 #i 赋值为0，再遍历一次所有的数据集 k = k + 1 #k + 1 即迭代次数加1 history.append([(alpha * y.T).dot(x), b]) #存储w，b print("iteration counter =",k) print( "alpha = ",alpha) print("b = ",b) continue else: #若某一数据点被正确分类 i = i + 1 print("i = ",i) if i >= x.shape[0]: #退出while循环条件,即 i >= 3,所有数据点都能正确分类 print("iteration finish") break #break 退出wile循环 w = (alphay.T).dot(x) #计算得到权值 w print("w = ", w) print("b = ", b) print("history w,b = ",history) fig = plt.figure() ax = plt.axes() line, = ax.plot([], [], 'g', lw=2) label = ax.text([], [], '') def init(): global x,y,line,label plt.axis([-6, 6, -6, 6]) plt.scatter(x[0:2,0],x[0:2,1],c ="r",label = "postive",s = 60) #画正样本点 plt.scatter(x[2,0],x[2,1],c = "y",label = "negtive",s =60) #画负样本点 plt.grid(True) plt.xlabel('X1') plt.ylabel('X2') plt.title('myPerceptron') return line, label #返回值为line，label对象，表示这两个对象有动画效果 def animate(i): #形参 i 表示帧数，即 animation.FuncAnimation 函数形参列表中的frames属性 global history, ax, line, label w = history[i][0] b = history[i][1] if w[1] == 0: return line,label x1 = -6.0 #点(x1,y1)和点(x2,y2)确定分类超平面 y1 = -(b + w[0] x1) / w[1] x2 = 6.0 y2 = -(b + w[0] * x2) / w[1] line.set_data([x1, x2], [y1, y2])#画出分类超平面 x1 = 0.0 y1 = -(b + w[0] * x1) / w[1] label.set_text(str( history[i][0]) + ' ' + str(b)) #在点 (0,y1) 上绘制文本便签 label.set_position([x1, y1]) return line, label anim = animation.FuncAnimation(fig, animate,init_func=init, frames=len(history), interval=1000, repeat=True,blit=True) plt.legend(fancybox = True) plt.show() #anim.save('perceptron.gif', fps=2, writer='imagemagick') #使用ImageMagick导出GIF图片感知机模型学习笔记及Python实现仙人掌_lz: Deep1994: 你后来解决了吗我拍这个程序也是这个提示大家在看回归预测\|基于小龙虾优化LightGBM的数据回归预测Matlab程序COA-LightGBM 多特征输入单输出含基础模型大一新生初入python第六天 BSL-3和BSL-4有什么区别事务 Atomicity Consistency Isolation Durability 广告联盟1 最新文章 2016年1篇目录目录分类专栏机器学习 1篇算法 python 1篇统计学习方法 1篇目录评论 1 被折叠的条评论为什么被折叠? 到【灌水乐园】发言查看更多评论添加红包祝福语请填写红包祝福语或标题红包数量个红包个数最小为10个红包总金额元红包金额最低5元余额支付当前余额3.43元前往充值 > 需支付：10.00元成就一亿技术人! 领取后你会自动成为博主和红包主的粉丝规则 hope_wisdom 发出的红包实付元使用余额支付点击重新获取扫码支付钱包余额 0 抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。余额充值