数据挖掘学习笔记--分类器

在圕学习

已于 2024-02-27 04:27:18 修改

阅读量867

点赞数 28

分类专栏：数据挖掘文章标签：数据挖掘学习笔记

于 2024-02-27 04:26:33 首次发布

本文链接：https://blog.csdn.net/weixin_45831948/article/details/136312062

版权

3 篇文章 0 订阅

订阅专栏

数据挖掘

在这里插入图片描述

$a=\sum^d_{i=1}w_i x_i =\overline W^T \overline X$

bias: 偏差
$a=\overline W^T \overline X+b$ 另一种表达形式 $a=\sum^d_{i=0}w_i x_i =\overline W^T \overline X$ from i=0从i 为0开始， $w_0=b$
Training 训练
- when it is misclassified( $y\cdot a \leq 0$ )
- update $b = b + y$
- $w_i=w_i+y\cdot x_i$ --for i in range (1,d)
features 感知器特征
- online algorithm 在线算法，一个一个处理训练数据（batch leaning 相反）
- error driven 错误驱动，参数只在分类错误时更新
training dataset randomly 训练集最好是打乱的数据
hyperparameter 超参
- 人选的参数，不由算法控制，靠经验
- MaxIter 迭代次数，感知器的超参
HyperPlane 超平面，决策边界 n 维空间，n-1维超平面
- ${\overline X:\overline W^T \overline X+b=0}$
限制：只能分类线性 linear separability
- non-linearly separable case: 环，月
  环，月分类，DBScan表现比较好
可找到超平面，即线性可分
决策边界，被最后一个训练数据影响
对于训练中的权重向量（weight verctors）取平均（averaged perceptron algorithm）

two strategies 两个策略

One vs one
- 握手准则所以需要比较 $\frac{1}{2}k\cdot (k-1)$ 次选投票最多的
- 缺点：break ties 瓶颈投票数相同
One vs rest
- 选分类模型最高分
- $y=argmax_{i\in \{1,2,...,k\}}A_i(\overline X)$

未完待续

关注