特征缩放（归一化Normalization）

姓蔡小朋友

已于 2024-07-19 16:37:41 修改

阅读量323

点赞数 4

分类专栏：机器学习文章标签：机器学习

于 2024-07-05 18:32:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53881899/article/details/140215348

版权

机器学习专栏收录该内容

35 篇文章 9 订阅

订阅专栏

目录

一、引入特征缩放：
二、特征缩放介绍：
三、如何实现特征缩放：
四、特征缩放合理范围：

一、引入特征缩放：

举个例子：如果数据集中有两个特征size、bedrooms，其中size范围是0–5，bedrooms范围是3–2000，试想这种不同特征取值范围差距很大的话会发生什么情况？有一种可能是会导致损失函数中w1参数轴会相对很短，w2轴会相对很长，这就导致三维损失函数很扁，用等高线损失图表示的话图像就会很扁：
在这里插入图片描述

在这里插入图片描述
如果用上述数据集进行训练，在梯度下降的时候计算偏导数（梯度）时会不准确，直接导致参数收敛速度变慢：

在这里插入图片描述
如何解决这个问题？答案就是使用特征缩放思想。

二、特征缩放介绍：

对于上面的例子，数据集中两个特征size、bedrooms的取值范围差别很大，我们可以将两个特征分别缩放到相同的取值范围内，这就是特征缩放。

例如将特征size、bedrooms的数据范围同时缩放到0–1区间内，这样的好处是参数值可取范围比较统一，等高线损失图相对更圆，在梯度下降时可以找到一条更直接的通往最优参数值（最小损失值）的路径，即梯度下降更快。

在这里插入图片描述

三、如何实现特征缩放：

注意是缩放特征，但是目的是为了使损失函数中参数可取范围统一，使得梯度下降更快。

1.分别除特征中最大值缩放到0—1：

在这里插入图片描述

2.均值归一化缩放到-1—1：

在这里插入图片描述

μ1为该特征的均值

3.Z-Score归一化：

在这里插入图片描述

μ1为改特征的均值
σ为该特征的标准差

四、特征缩放合理范围：

在这里插入图片描述

姓蔡小朋友

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
特征缩放（归一化Normalization）

特征缩放
复制链接

扫一扫

专栏目录

姓蔡小朋友 CSDN认证博客专家 CSDN认证企业博客

码龄4年

Java领域优质创作者

285: 原创

2152: 周排名

7528: 总排名

25万+: 访问

: 等级

3685: 积分

1万+: 粉丝

788: 获赞

82: 评论

1456: 收藏

私信

关注

热门文章

分类专栏

深度学习 6篇
机器学习 35篇
Pytorch 5篇
JavaWEB 30篇
Vue 8篇
算法 21篇
Python 1篇
HTML+CSS 3篇
计算机网络 3篇
Android开发 15篇
Javase 31篇
Spring 7篇
Maven 6篇
设计模式 4篇
SpringMVC 14篇
MyBatis 23篇
数据结构C语言 7篇
jQuery 10篇
Hibernate 5篇
操作系统 2篇
JavaScript 28篇
Bootstrap 1篇
AJAX 12篇
JDBC 4篇
XML解析 3篇

最新评论

Informer：高效长序列时间序列预测模型（更新中）
你的名字（学习中）: 博主好，我用我的数据集运行出来后预测部分是这样的，没预测结果，数据集共457条，是因为我的数据集太少了嘛，还是我的参数填错了呀？informer_custom_ftMS_sl72_ll48_pl10_dm624_nh15_el2_dl1_df2048_atprob_fc5_ebtimeF_dtTrue_mxTrue_test_0<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< pred 1
Informer：高效长序列时间序列预测模型（更新中）
你的名字（学习中）: 你好，请问你解决了嘛，我也出现了这个问题
Informer：高效长序列时间序列预测模型（更新中）
姓蔡小朋友: 我就画了第一个batch的真实值和预测值
Informer：高效长序列时间序列预测模型（更新中）
西柚不是白痴: 想问一下大佬出的图是怎么出的呢？我的preds和trueds输出的npy文件都是三维的数据，里面包含了批次数和批次样本数的乘积，画出来的图只是一个切片的图，并不是发展趋势的图，对比图也没有意义，哥您是咋画的呀
Informer：高效长序列时间序列预测模型（更新中）
姓蔡小朋友: 预处理完后手动删除，保留了RAT这个地区的数据，因为感觉不同地区数据直接相关性不大

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

姓蔡小朋友 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。