python归一化 增大差异_归一化&标准化

本文详细介绍了Python中数据预处理的两种重要方法——归一化和标准化,包括它们的定义、作用、应用场景。归一化常用于机器学习中使不同量纲特征映射到[0, 1]或[-1, 1]区间,而标准化通过Z-score转换,使数据符合正态分布。文章强调了在涉及距离计算的算法如K-means、PCA、SVM时,特征缩放的重要性,并指出在PCA之前进行标准化可能更优。同时,文章指出在概率模型如朴素贝叶斯和基于树的模型如决策树中,通常不需要进行特征缩放。" 7626059,480328,Python遍历目录文件并导入数据库,"['Python', '数据库', '文件处理']
摘要由CSDN通过智能技术生成

1、归一化是将数值放缩到[0, 1]或者[-1, 1]

equation?tex=x%27+%3D+%5Cfrac%7B%7Bx+-+%5Cmin+%28x%29%7D%7D%7B%7B%5Cmax+%28x%29+-+%5Cmin+%28x%29%7D%7D

常用于机器学习计算多个不同量纲的特征映射到[0, 1]或者[-1, 1],所以该值受有最大值和最小值决定

2、z-score

由于Z-score的数据分布满足“正态分布”(N(0,1)),而“正态分布”又被称为“Z-分布”,所以该方法被称为“Z-score”

Z-score是用于做数据规范化处理的一种方法

6dbd5dbf835d3f6c8cb90e286a37774f.png

Z-score物理意义

Z-score表示原始数据偏离均值的距离长短,而该距离度量的标准是标准方差。

Z-score大于零表示该数据大于均值。

Z-score小于零表示该数据小于均值。

Z-score等于零表示该数据等于均值。

Z-score等于“1”表示该数据比均值大一个标准方差。

Z-sc

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值