数据挖掘学习笔记--分类器

数据挖掘

目录



分类器

  • 经典分类器
    • 多分类
      • KNN
      • Naive bayes 朴素贝叶斯
    • 二元分类binary
      • Perceptron 感知器
      • logistic regression 逻辑回归
        • 使用逻辑函数sigmoid g ( z ) = 1 1 + e − z g(z)=\frac{1}{1+e^{-z}} g(z)=1+ez1对可能性处理
        • 原始 P ( Y ∣ X ) = w T x + b P(Y|X)=w^Tx+b P(YX)=wTx+b
        • P ( Y ∣ X ) = 1 1 + e − w T x + b P(Y|X)=\frac{1}{1+e^{-w^Tx+b}} P(YX)=1+ewTx+b1

Perceptron 感知器 二元分类算法

在这里插入图片描述

基本模型

a = ∑ i = 1 d w i x i = W ‾ T X ‾ a=\sum^d_{i=1}w_i x_i =\overline W^T \overline X a=i=1dwixi=WTX

  • bias: 偏差
    a = W ‾ T X ‾ + b a=\overline W^T \overline X+b a=WTX+b 另一种表达形式 a = ∑ i = 0 d w i x i = W ‾ T X ‾ a=\sum^d_{i=0}w_i x_i =\overline W^T \overline X a=i=0dwixi=WTX from i=0从i 为0开始, w 0 = b w_0=b w0=b

  • Training 训练

    • when it is misclassified( y ⋅ a ≤ 0 y\cdot a \leq 0 ya0)
    • update b = b + y b=b+y b=b+y
    • w i = w i + y ⋅ x i w_i=w_i+y\cdot x_i wi=wi+yxi --for i in range (1,d)
  • features 感知器特征

    • online algorithm 在线算法,一个一个处理训练数据(batch leaning 相反)
    • error driven 错误驱动,参数只在分类错误时更新
  • training dataset randomly 训练集最好是打乱的数据

  • hyperparameter 超参

    • 人选的参数,不由算法控制,靠经验
    • MaxIter 迭代次数,感知器的超参
  • HyperPlane 超平面,决策边界 n 维空间,n-1维超平面

    • X ‾ : W ‾ T X ‾ + b = 0 {\overline X:\overline W^T \overline X+b=0} X:WTX+b=0
  • 限制:只能分类线性 linear separability

    • non-linearly separable case: 环,月
      环,月分类,DBScan表现比较好
  • 可找到超平面,即线性可分

  • 决策边界,被最后一个训练数据影响

  • 对于训练中的权重向量(weight verctors)取平均(averaged perceptron algorithm)

Use Binary classifier as Multiclass classifier 二元分类器用作多元

two strategies 两个策略

  • One vs one
    • 握手准则所以需要比较 1 2 k ⋅ ( k − 1 ) \frac{1}{2}k\cdot (k-1) 21k(k1)次 选投票最多的
    • 缺点:break ties 瓶颈 投票数相同
  • One vs rest
    • 选分类模型 最高分
    • y = a r g m a x i ∈ { 1 , 2 , . . . , k } A i ( X ‾ ) y=argmax_{i\in \{1,2,...,k\}}A_i(\overline X) y=argmaxi{1,2,...,k}Ai(X)

损失函数 Loss function


未完待续

  • 28
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

在圕学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值