LR模型相关知识点

最新推荐文章于 2024-07-17 20:43:45 发布

仰望夏日

最新推荐文章于 2024-07-17 20:43:45 发布

阅读量814

点赞数

文章标签：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49717022/article/details/111784667

版权

LR模型相关知识点

归一化

机器学习中为什么需要归一化？
（1）消除量纲影响
健康=3身高+2体重，身高单位：米，体重单位：斤
Δ身高=0.3，Δ体重=5，前者变化更大，但‘健康’指标变化小
（2）可以加速优化过程，后加快了梯度下降求最优解的速度；（减少迭代次数，加快模型的训练）
数据归一化后，最优解的寻优过程明显会变得平缓，更容易正确的收敛到最优解。

两个特征区别相差特别大。所形成的等高线比较尖锐。当时用梯度下降法时，很可能要垂直等高线走，需要很多次迭代才能收敛。

在这里插入图片描述
对两个原始特征进行了归一化处理，其对应的等高线相对来说比较圆，在梯度下降时，可以较快的收敛。

（3）归一化有可能提高精度
有些分类器需要计算样本之间的距离，例如k-means。如果一个特征的值域范围特别大。那么距离计算就主要取决于这个特征，有时会与实际情况相违背。（比如这时实际情况是值域范围小的特征更重要）

哪些归一化的方法？

Ⅰ 线性函数归一化
在这里插入图片描述

缺陷：
1）当有新数据加入时，可能导致max和min的变化，需要重新定义
2）存在极端的最大最小值，即易受异常值影响
适用：
如果对输出结果范围有要求，用归一化
如果数据较为稳定，不存在极端的最大最小值，用归一化

Ⅱ 0均值标准化
在这里插入图片描述

适用：
如果数据存在异常值和较多噪音，用标准化，可以间接通过中心化避免异常值和极端值的影响

归一化与标准化的区别

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LR模型相关知识点

@[TOC]LR模型相关知识点#1.LR归一化问题，什么情况可以不归一化，什么情况必须归一化，#2.为什么提到LR损失函数要能知道交叉熵，为什么是它，以它为损失函数在优化的是一个什么东西，知道它和KL散度以及相对熵的关系#3.提到LR的求解方法，比如SGD，知道SGD和BGD的区别，知道不同的GD方法有什么区别和联系，二阶优化算法知道什么，对比offline learning和online learning的区别#4.提到调参，知道模型不同超参数的含义，以及给定一个特定情况，大概要调整哪些参数，怎么
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。