准备数据:归一化数值

归一化是数据预处理的重要步骤,通过线性、对数或反余切函数转换,将特征值缩放至特定区间,如[0, 1]或[-1, 1]。这一过程有助于简化计算,加快模型训练速度,尤其在神经网络中,能提高收敛性。归一化还有助于统一样本的统计分布,但是否使用归一化需考虑数据分布和具体应用场景,有时标准化可能是更好的选择。" 106623474,9531328,Scrapy教程:Python爬虫框架详解与实战,"['Python', '爬虫框架', '数据抓取', 'Scrapy']
摘要由CSDN通过智能技术生成

归一化数值

在处理这种不同取值范围的特征值时,我们通常采用的方法是将数值归一化,如将取值范围处理为0到1或者-1到1之间。下面的公式可以将任意取值范围的特征值转化为0到1区间内的值:
newValue=(oldValue-min)/(max-min)
其中min和max分别是数据集中的最小特征值和最大特征值。

一般的三种归一化方法:
1、线性函数转换,表达式如下:

    y=(x-MinValue)/(MaxValue-MinValue) 归一化至[0 1]

   y=2*(x-MinValue)/(MaxValue-MinValue)-1  归一化至[-1 1]

2、对数函数转换,表达式如下:

    y=log10 (x)

3、反余切函数转换 ,表达式如下:

    y=arctan(x)*2/PI

归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。归一化是为了加快训练网络的收敛性,可以不进行归一化处理

归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1–+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是同一在0-1之间的统计概率分布;SVM是以降维后线性划分距离来分类和仿真的,因此时空降维归一化是统一在-1–+1之间的统计坐标分布。

当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值