Logistic回归算法总结

最新推荐文章于 2023-12-15 17:00:28 发布

Gavid-jh

最新推荐文章于 2023-12-15 17:00:28 发布

阅读量766

点赞数 1

本文链接：https://blog.csdn.net/weixin_42230550/article/details/84452211

版权

machine learning 专栏收录该内容

14 篇文章 1 订阅

订阅专栏

1.Logistic回归算法的前提基础

1.1回归概念

假设现在有一些数据点，我们用一条直线对这些点进行拟合（这条直线称为最佳拟合直线），这个拟合的过程就叫做回归。

1.2sigmoid函数

问题需求：二值型输出分类函数：在两个类的情况下，上述函数输出 0 或 1.或许你之前接触过具有这种性质的函数，该函数称为海维塞得阶跃函数(Heaviside step function)，或者直接称为单位阶跃函数。然而，海维塞得阶跃函数的问题在于: 该函数在跳跃点上从 0 瞬间跳跃到1，这个瞬间跳跃过程有时很难处理。幸好，另一个函数也有类似的性质（可以输出 0 或者 1 的性质），且数学上更易处理，这就是 Sigmoid 函数。

计算公式： $\sigma (z)=\frac{1}{1+e^{-z}}$

$z=w_{0}x_{0}+w_{1}x_{1}+...+w_{n}x_{n}$ 采用向量法，可以写成： $z=w^{T}x$

曲线图：

1.3梯度上升&&梯度下降

目的：为了寻找最佳参数 $w$ ,使得分类器尽可能地精确。

梯度：用 $\bigtriangledown$ 表示，则函数 $f(x,y)$ 的梯度表达式为：

$\bigtriangledown f(x,y)=\bigl(\begin{smallmatrix} \frac{\partial f(x,y)}{\partial x} \\ \frac{\partial f(x,y)}{\partial y} \end{smallmatrix}\bigr)$

这个梯度意味着要沿 x 的方向移动 $\frac{\partial f(x,y)}{\partial x}$ ，沿 y 的方向移动 $\frac{\partial f(x,y)}{\partial y}$ 。其中，函数f(x, y) 必须要在待计算的点上有定义并且可微。

梯度上升公式： $w:= w+\alpha \bigtriangledown _{w}f(w)$ ——用来找全局最大值

梯度下降公式： $w:= w-\alpha \bigtriangledown _{w}f(w)$ ——用来找全局最小值

α：上面的梯度算法的迭代公式中的阿尔法，这个代表的是移动步长。移动步长会影响最终结果的拟合程度，最好的方法就是随着迭代次数更改移动步长。

▽f(w)：代表沿着梯度变化的方向。

2.Logistic回归工作原理

每个回归系数初始化为 1
重复 R 次:
计算整个数据集的梯度
使用步长 x 梯度更新回归系数的向量
返回回归系数

3.Logistic回归开发流程

收集数据: 采用任意方法收集数据
准备数据: 由于需要进行距离计算，因此要求数据类型为数值型。另外，结构化数据格式则最佳。
分析数据: 采用任意方法对数据进行分析。
训练算法: 大部分时间将用于训练，训练的目的是为了找到最佳的分类回归系数。
测试算法: 一旦训练步骤完成，分类将会很快。
使用算法: 首先，我们需要输入一些数据，并将其转换成对应的结构化数值；接着，基于训练好的回归系数就可以对这些数值进行简单的回归计算，判定它们属于哪个类别。

4.Logistic回归算法特点

优点: 计算代价不高，易于理解和实现。
缺点: 容易欠拟合，分类精度可能不高。
适用数据类型: 数值型和标称型数据

5.Logistic回归关键代码实现

（后续更新）

Gavid-jh

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Logistic回归算法总结

1.Logistic回归算法的前提基础1.1回归概念假设现在有一些数据点，我们用一条直线对这些点进行拟合（这条直线称为最佳拟合直线），这个拟合的过程就叫做回归。1.2sigmoid函数问题需求：二值型输出分类函数：在两个类的情况下，上述函数输出 0 或 1.或许你之前接触过具有这种性质的函数，该函数称为海维塞得阶跃函数(Heaviside step function)，或者...
复制链接

扫一扫