机器学习笔记(一)--归一化与标准化与正则化

最新推荐文章于 2023-04-16 10:04:38 发布

LawGeorge

最新推荐文章于 2023-04-16 10:04:38 发布

阅读量742

点赞数

本文链接：https://blog.csdn.net/LawGeorge/article/details/86605366

版权

优秀文章：https://zhuanlan.zhihu.com/p/29957294

一、归一化

归一化目的是将数据映射到同一个范围，增加可比性。

二、标准化

标准化目地是加速收敛，更快找到最优解，计算上与正态分布标准化类似，变换在空间中的位置。

三、正则化

正则化目的是避免过拟合，减少误差。计算上在一般loss函数上加上正则项，有L1正则，L2正则，可以看做是损失函数的惩罚项。使用L1正则化的模型叫做Lasso回归，使用L2正则化的模型叫做Ridge回归。

L1正则化是指权值向量中各个元素的绝对值之和。可以产生稀疏权值矩阵，换句话就是能够得到某些权值为0的解，可用于特征选择。

L2正则化是指权值向量w中各个元素的平方和然后再求平方根。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LawGeorge

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

人工智能基础_机器学习022_使用正则化_曼哈顿距离_欧氏距离_提高模型鲁棒性_过拟合_欠拟合_正则化提高模型泛化能力---人工智能工作笔记0062

添柴程序猿的专栏

11-10

663

然后我们再来看一下,过拟合和欠拟合,现在,实际上欠拟合,出现的情况已经不多了,欠拟合是。在训练集和测试集的准确率不高,学习不到位的情况.

正则化（岭回归、lasso回归）、归一化、标准化、离散化、白化、权重、学习率

随笔

08-10

856

文章目录正则化、归一化、标准化、离散化、白化1.介绍2.L1、L2正则化2.1 为什么参数稀疏一定程度上会避免过拟合？（L1）2.2 为什么参数越小代表模型越可避免过拟合？（L2）2.3 L1使参数稀疏、L2使参数小的原因？3 权重衰减与L2的区别3.1 首先看下权重衰减是什么?3.2 然后L2为什么可以实现权重衰减？4. 学习率衰减5. 权重衰减和学习率衰减考虑 正则化、归一化、标准化、离散化、白化 https://www.bilibili.com/read/cv10712991 1.介绍 正则化的本质可

参与评论您还未登录，请先登录后发表或查看评论

[机智的机器在学习] 机器学习中的归一化和正则化问题

HappinessSourceL的博客

12-17

341

今天我们要说的是，在机器学习常用的算法里面，那些需要归一化，那些不需要，通过scikit-learn中的预处理的一些方法，实际了解如何正则化和归一化数据。看完本文，应该对于一般的机器学习任务，都可以轻松上手操作。先看一下归一化是什么意思，对于一个机器学习任务来说，首先要有数据，数据怎么来？一种情况是别人整理好给你，一种是自己造数据，根据不同的业务场景，自己提取想要的数据，一般来自各个维度的数据...

彻底搞懂机器学习中的正则化

LifeBackwards的专栏

07-02

636

正则化在机器学习当中是十分常见的，本次就来比较完整地总结一下~ 首先列一下本篇文章所包含的内容目录，方便各位查找： LP范数 L1范数 L2范数 L1范数和L2范数的区别 Dropout Batch Normalization 归一化、标准化 & 正则化 正则化 在总结正则化（Regularization）之前，我们先谈一谈正则化是什么，为什么要正则化。其实正则化的本质很简单，就是对某一问题加以先验的限制或约束以达到

机器学习算法 05 归一化和正则化 &房价预测案列

weixin_41672684的博客

01-02

1106

一理解归一化：梯度的求导公式：通过这个公式我们可以发现：theta j的梯度与第j列的特征值相关，成正比。如果这一列的特征值约大，那么这一列的梯度就越大，梯度越大更新下降的就越快，越容易达到该方向的最优值。从下面的图中可以看出，theta2 的更新幅度比theta1要大。注意：某个theta达到最优值后，并不不变化了，随着训练的进行，会发生震荡。震荡的产生又增加了训练的次数，为了减小这种现象。我们需要将训练样本进行归一化，来消除量纲不同的影响。 归一化方法： min_max sc

机器学习中的标准化/归一化

不眠旅行

09-20

1万+

数据的标准化是将数据按比例缩放，使之落入一个小的特定区间。在一些数据比较和评价中常用到。典型的有归一化方法。归一化方法的主要有两种形式：一种是把数变为（0，1）之间的小数，一种是把有量纲表达式变为无量纲表达式。笔记的目的是弄清概念，和python的实现。

归一化 正则化 标准化

wtt561111的专栏

07-01

1431

标准化是对列进行归一化操作，主要包括： standardScaler：将特征标准化为单位标准差或是0均值，或是0均值单位标准差。 minmaxScaler：将特征的值缩放到[0,1]范围。x=(x-min)/(max-min) MaxAbsScaler：将特征的值缩放到[-1,1]范围。x=x / max|x| 为什么要进行标准化操作？在现实生活中，一个目标变量（y）可以认为是...

机器学习笔记之正则化(六)批标准化(BatchNormalization)

热门推荐

Microstrong

11-26

10万+

我的个人微信公众号：Microstrong 微信公众号ID：MicrostrongAI 公众号介绍：Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容，分享在学习过程中的读书笔记！期待您的关注，欢迎一起学习交流进步！知乎专栏：https://zhuanlan.zhihu.com/Microstrong 个人博客：https://blog.csd...

机器学习之预测股票价格模型---学习笔记（获取历史行情数据、数据归一化、正则化处理）

changblade的专栏

03-07

4586

一、获取历史行情数据import tushare as ts df=ts.get_hist_data('600999',start='2016-06-15',end='2018-03-07') dd=df[['open','high','low','close']] df 可以得到如下结果：二、数据归一化处理 data_all = np.array(df).astype(float) ...

归一化与标准化处理

旧人赋荒年

10-29

4558

1, 归一化把数据经过处理后限制在想要的范围内，比如[0,1]，有量纲表达式变为无量纲表达式，成为纯量。一般采用最大-最小规范化对原始数据进行线性变换公式：X=（X−Xmin）/(Xmax−Xmin)X =（X-Xmin）/(Xmax-Xmin) matlab归一化函数： [y,ps] = mapminmax(x,ymin,ymax) x输入矩阵，ymin,ymax归一化区

定向光流直方图是什么_HOG-定向梯度直方图（汽车标识识别）

weixin_35653597的博客

01-04

721

方向梯度直方图(简称HOG)是主要用于计算机视觉和机器学习以进行物体检测的描述符。但是，我们也可以使用HOG描述符来量化和表示形状和纹理。HOG特征首先由Dalal和Triggs在其CVPR 2005论文“人体检测的方向梯度直方图”中引入。在他们的工作中，Dalal和Triggs提出了HOG和一个5阶描述符来对静止图像中的人进行分类。这5个阶段包括：在描述之前归一化图像。计算x 和 y 方向...

[转]快速计算平方根倒数的一个算法

looongson的专栏

03-09

3424

在3D图形编程中，经常要求平方根或平方根的倒数，例如：求向量的长度或将向量归一化。C数学函数库中的sqrt具有理想的精度，但对于3D游戏程式来说速度太慢。我们希望能够在保证足够的精度的同时，进一步提高速度。Carmack在QUAKE3中使用了下面的算法，它第一次在公众场合出现的时候，几乎震住了所有的人。据说该算法其实并不是Carmack发明的，它真正的作者是Nvidia的Gary Tar

归一化

QuanQuanYuanXin的博客

02-22

1088

归一化是在实现算法时经常使用的操作。本文的目的是说明归一化的作用。 归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为标量。在多种计算中都经常用到这种方法（百度百科）。假设有一组数列，或者说向量（1,2,3,4）一、使用无穷范数归一化 无穷范数是指这组数列中最大的数，即4，归一化后结果为（1/4,2/

机器学习中的范数规则化之（一）L0、L1与L2范数

bitcarmanlee的博客

07-17

5785

1.监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”，也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们的训练数据，而规则化参数是防止我们的模型过分拟合我们的训练数据。多么简约的哲学啊！因为参数太多，会导致我们的模型复杂度上升，容易过拟合，也就是我们的训练误差会很小。但训练误差小并不是我们的最

平方根（sqrt）算法

开发之路

07-22

1万+

最近听说开平方算法挺难写，自己思考一下确实这些库函数只是一直在用，但是很少去思考如何实现的，sqrt在排序中使用频率非常的高，所以就研究了一下。大概有三种实现方式。一、用二分的方法每次用中间数就试，如果大就到左区间选取中间数试，如果小就到右区间找中间数试，采用不断逼近的方式计算平方根，这种方式迭代次数有点多，且每次试验都要进行运算，效率不是很高，但是思路简单，巧妙的运用了二

keras神经网络常见问题-mse, nmse

csmqq的专栏

06-28

8458

1. the History callback gives only loss and acc for each epoch, how can I get the loss for each batch ? predict = model.predict(batch) loss = MSE(batch,predict) or Here's a simple example

机器学习笔记：归一化与偏差/方差分析

"该资源是一份关于机器学习的个人笔记，源自斯坦福大学2014年的课程，涵盖了机器学习的基础理论和实践技术，包括监督学习、无监督学习以及最佳实践，如偏差/方差理论。笔记作者是黄海广，他提供了视频、课件和翻译过...