《机器学习实战中文版》 Logistic回归

最新推荐文章于 2024-09-23 20:31:41 发布

香槟酒气满天飞

最新推荐文章于 2024-09-23 20:31:41 发布

阅读量143

点赞数

分类专栏：啃书笔记（机器学习实战中文版）文章标签： 1024程序员节机器学习

本文链接：https://blog.csdn.net/kangxiatao/article/details/109259597

版权

10 篇文章 0 订阅

订阅专栏

建立回归公式，寻找最佳拟合参数，根据边界线进行分类
优点：计算代价不高，易于理解和实现。
缺点：容易欠拟合，分类精度可能不高。
适用数据类型：数值型和标称型数据。

Sigmoid函数
$\sigma(z)=\frac{1}{1+\mathrm{e}^{-z}}$
当横坐标足够大时，可以看成一个阶跃函数，很好的处理了在零点时瞬间跳跃的问题
最佳回归系数确定
Sigmoid函数的输入为 $z$ ，用向量可以写成 $z=w^{T} x$ ，表示这两个向量对应相乘再相加， $x$ 是输入的数据， $w$ 即要寻找的最佳参数
- 梯度上升法
  简单来说就是函数对 $x y$ 求偏导得出梯度 $\nabla_{w} f(w)$ ，需要函数在该点有定义并可微，再设置一定步长，记作 $\alpha$ ，迭代公式如下： $w=w+\alpha \nabla_{w} f(w)$
  迭代停止的条件可以是某个特定的值或者算法到一个允许的误差范围
- 梯度下降法
  上述公式中加号换成减号即可，梯度上升是寻找最大值，下降则是寻找最小值
书上提到的数据点划分只有两个坐标 $x_{1}$ 和 $x_{2}$ ，他加入了 $x_{0}=1$ 把 $w_{0}$ 作为常数项，整体过程可以理解为：
- 根据Sigmoid函数把 $0$ 作为数据点的分界处
- 设定 $0=w_{0} x_{0}+w_{1} x_{1} + w_{2} x_{2}$
- 利用Logistic回归找出三个 $w$ 的最优解
- 解出 $X{1}和X{2}$ 的关系式
- 得到最佳拟合直线