机器学习之logistic回归与分类

本文详细介绍了Logistic回归作为简单分类算法的工作原理,包括使用线性函数划分数据,通过sigmoid函数映射到0-1区间解决阈值问题,以及在二分类和多分类问题中的应用。通过实例展示了在MATLAB环境下Logistic回归的实现过程,探讨了不同训练方法和参数设定对分类效果的影响。
摘要由CSDN通过智能技术生成

logistic回归与分类是一种简单的分类算法。在分类的过程中只需要找到一个划分不同类的权重向量即可,对新的数据只需要乘上这个向量并比较就可以得到分类。比如下图的二分类问题:
这里写图片描述
每个样本点可以看成包含两个特征(x1,x2),现在需要把他们分开,如果这是训练集,他们本身属于哪一个类是已知的,比如说蓝色的属于0类,红色的属于1类,现在我们想通过这些数据建立一个分类标准可以将他们分开,这样再来了一个不知道类别的数据,我们看看这个标准就知道他是属于哪一类的。

像上面这个线性的,那么我们可以建立一个函数模型,假设有一个函数 z=w1x1+w2x2 可以将他们分开,也就是每一个样本(x1,x2)通过这个函数有一个z,当z大于某个值就认为属于第一类,否则属于第二类。那么我们知道,样本确定后(x1,x2)不能变了,那么我们想办法变化这个函数的权值系数(w1,w2)。这个简单的式子可以化简成 x2=kx1+b 的形式,看到这不是一元函数吗,只要有了适当的k和b就可以画出上面的分割线是不是。

下面的问题,如何找到w1与w2,因为我们的数据是已知属于哪一类的了,那么这样的话我们可以开始随机给一组w1与w2,然后将每个点(或者所有点)带到这个函数中,假设我们的z的阈值给的是100,那么带一个点(x1,x2)进去算,发现得到的z=50,划分到第一类,然而实际情况是第二类,划分错了,这样我们调整一下(w1,w2),再来划分下一个点,就这样一直下去直到(w1,w2)能很好的划分出这些数据为止。

Logistic寻找参数的过程就是这样,那么这里就有几个问题:
(1)关于阈值z=50的选择
为什么你选择50,不是100,200呢?我们知道当x1与x2的数值(范围)变化了之和,这个阈值会变化的。所以为了消除这个影响,我们将得到的z在进行一个映射,这个映射函数就是sigmod函数,函数的形式如下:

σ(
  • 6
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值