机器学习:线性分类问题(基础知识)

本文介绍了机器学习中的线性分类问题,包括超平面的定义及其表达式,线性函数如何刻画距离,以及不同类型的相似度度量如欧式距离和曼哈顿距离。接着详细讨论了分类问题的定义、评估方法(如错误率、准确率、查准率和查全率)以及性能评价。此外,还解释了线性判别函数和线性分类器的工作原理,并提及了线性分类器的选择。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


本文属于我的机器学习/深度学习系列文章,点此查看系列文章目录

一、超平面

超平面不一定是一个面,它是所处向量空间的一个子空间,如立体空间中一个面,二维平面上一条线。它的作用在于将空间中的数据一分为二,达到分类的目的。

1.1 超平面表达式

g ( x ) = w T x + w 0 = 0 g(x) = \mathbf w^T\mathbf x+w_0 = 0\\ g(x)=wTx+w0=0

  • w = ( w 1 , w 2 , . . . , w l ) T \mathbf w = (w_1,w_2,...,w_l)^T w=(w1,w2,...,wl)T,权向量(超平面法向量)
  • x = ( x 1 , x 2 , . . . , x l ) T \mathbf x = (x_1,x_2,...,x_l)^T x=(x1,x2,...,xl)T,实例(样本向量)
  • w 0 w_0 w0,偏移量
    在实际中,w确定,因此这个方程代表所有满足的向量x(点)的集合, w T x w^Tx wTx可视为x向w的投影乘以w的模长

这个方程的解读也可以是x向w的投影长度为 − w 0 ∣ ∣ w ∣ ∣ \frac{-w_0}{||w||} ww0的点集合。

二、线性函数:距离刻画

上面的超平面定义了所有在超平面上的点,那如果是不在超平面上的点与该超平面又有什么关系?

x p x_p xp是x在超平面 w T x + w 0 = 0 \mathbf w^T\mathbf x+w_0=0 wTx+w0=0的投影点,得公式如下:
x = x p + ( x − x p ) w T x ∣ ∣ w ∣ ∣ = w T x p ∣ ∣ w ∣ ∣ + w T ( x − x p ) ∣ ∣ w ∣ ∣ , 两 边 同 时 乘 上 w T ∣ ∣ w ∣ ∣ \mathbf x = \mathbf x_p + (\mathbf x-\mathbf x_p) \\ \frac{\mathbf w^Tx}{||\mathbf w||} = \frac{\mathbf w^T\mathbf x_p}{||\mathbf w||} + \frac{\mathbf w^T(\mathbf x - \mathbf x_p)}{||\mathbf w||}, 两边同时乘上 \frac{\mathbf w^T}{||\mathbf w||} \\ x=xp+(xxp)wwTx=wwTxp+wwT(xxp),wwT
可绘出图例如下:
在这里插入图片描述

令 d = w T x p ∣ ∣ w ∣ ∣ , z = w T ( x − x p ) ∣ ∣ w ∣ ∣ 结 合   w T x p + w 0 = 0 , 有 d = − w 0 ∣ ∣ w ∣ ∣ , z = w T x + w 0 ∣ ∣ w ∣ ∣ = g ( x ) ∣ ∣ w ∣ ∣ 令d = \frac{\mathbf w^T\mathbf x_p}{||\mathbf w||},z = \frac{\mathbf w^T(\mathbf x - \mathbf x_p)}{||\mathbf w||}\\ 结合\ \mathbf w^T\mathbf x_p + w_0 = 0,\\ 有d = \frac{-w_0}{||\mathbf w||},z = \frac{\mathbf w^T\mathbf x+w_0}{||\mathbf w||} = \frac{g(\mathbf x)}{||\mathbf w||} d=wwTxp,z=w

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值