归一化和标准化以及欧氏距离

      当前项目中需要对所有图表计算它们之间的相似性,我们通过计算两两图表间的欧式距离来衡量其相似性。然而直接使用图表的原始数据进行计算会导致即使图表相似性极高但因为数据范围差别过大而失败,这里我们考虑对原始数据进行处理,将所有数据映射到某一个固定区间之内再计算。

    这里就用到了特征缩放(Feature scaling),特征缩放(Feature Scaling)是将不同特征的值量化到同一区间的方法,也是预处理中容易忽视的关键步骤之一。这里,就要了解一些具体的方法:标准化(Standardization归一化(Normalization

以下内容如有误漏敬请指正。

1.归一化(Normalization)

概念:

将数据映射到[0,1]或[-1,1]区间内,不会改变数据的特征,将有量纲的表达式转换成无量纲的表达式,即标量。

常用方法:

min-max normalization:

min(x):样本最小值,max(x):样本最大值,但是最大最小值容易受到异常点的影响,健壮性比较差,使用于传统的精确小数据。

Mean normalization:

average(x):样本均值。

2.标准化(Standardization):

概念:

将数据标准化处理之后,均值变为0,方差变为1,即服从标准正态分布。

常用方法:

z-score标准化:

σ:样本标准差。

3.如何选择以上两种方法

  1. 如果对输出结果范围有要求,用归一化。
  2. 如果数据较为稳定,不存在极端的最大最小值,用归一化。
  3. 如果数据存在异常值和较多噪音,用标准化,可以间接通过中心化避免异常值和极端值的影响。

 

  • 3
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在MATLAB中,数据归一化是将数据缩放到特定的范围内,常见的归一化方法包括最小-最大归一化、Z-score归一化和范数归一化。 最小-最大归一化是将原始数据线性化转换到的范围内,公式为x2=(x-xmin)/(xmax-xmin),其中xmax为样本数据的最大值,xmin为样本数据的最小值。这种方法的缺点是当新数据加入时,可能需要重新定义最大值和最小值。 Z-score归一化,也称为标准差标准化,将数据缩放到均值为0,标准差为1的标准正态分布中。具体方法是将每个特征的值减去特征的平均值,然后除以特征的标准差。 范数归一化是将数据缩放到单位长度的范围内。常见的范数归一化方法包括欧氏距离归一化、曼哈顿距离归一化等。 在MATLAB中,可以使用相应的函数进行数据归一化操作。例如,mapminmax函数用于最大最小归一化,mapstd函数用于标准归一化。 综上所述,MATLAB提供了多种方法进行数据归一化,可以根据具体需求选择合适的方法进行数据预处理。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [matlab:归一化](https://blog.csdn.net/it_xiangqiang/article/details/129862341)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [Matlab归一化方法](https://blog.csdn.net/u012233954/article/details/80263920)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值