3.4.2数据标准化（一） - Z-Score标准化

最新推荐文章于 2024-08-20 22:03:48 发布

进击的橘子猫

最新推荐文章于 2024-08-20 22:03:48 发布

阅读量10w+

点赞数 61

分类专栏：数据分析与挖掘框架 R模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/orange_spotty_cat/article/details/80312154

版权

Z-Score标准化是将不同量级数据转化为统一量度的处理方法，提高数据可比性。它通过（x-μ）/σ计算，位于数据分析与挖掘体系的数据准备阶段。Z-Score简化了比较，但需要总体均值与标准差，适用于正态分布数据，且可能导致数据解释性的损失。在R中，可以通过简单公式直接计算。

摘要由CSDN通过智能技术生成

简介

Z-Score标准化是数据处理的一种常用方法。通过它能够将不同量级的数据转化为统一量度的Z-Score分值进行比较。

一句话解释版本：

Z-Score通过（x-μ）/σ将两组或多组数据转化为无单位的Z-Score分值，使得数据标准统一化，提高了数据可比性，削弱了数据解释性。

数据分析与挖掘体系位置

Z-Score标准化是数据处理的方法之一。在数据标准化中，常见的方法有如下三种：

Z-Score 标准化
最大最小标准化
小数定标法

本篇主要介绍第一种数据标准化的方法，Z-Score标准化。

此方法在整个数据分析与挖掘体系中的位置如下图所示。

Z-Score的定义

Z-Score处理方法处于整个框架中的数据准备阶段。也就是说，在源数据通过网络爬虫、接口或其他方式进入数据库中后，下一步就要进行的数据预处理阶段中的重要步骤。

数据分析与挖掘中，很多方法需要样本符合一定的标准，如果需要分析的诸多自变量不是同一个量级

最低0.47元/天解锁文章

进击的橘子猫

关注

61
点赞
踩
288

收藏

觉得还不错? 一键收藏
10
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

进击的橘子猫 CSDN认证博客专家 CSDN认证企业博客

码龄6年

47: 原创

6万+: 周排名

224万+: 总排名

78万+: 访问

: 等级

3500: 积分

725: 粉丝

593: 获赞

86: 评论

2881: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据科学猫：数据预处理之数据分箱(Binning)
n5: 非常好的文章。请问分箱之后怎么处理呢？比如等距分箱，得到 df['等距分箱'] 这个新的列后，怎么处理原始的列，然后可以让模型使用啊? 我看到有人会填充原始列所属的箱号，还有说分箱后一个特征变成了多个特征但我不知道怎么操作，还有说要onehot编码，楼主好人能讲讲吗，可能对大佬是不值一提的小问题，但小白往往就差这最后一下导致整个流程跑不起来，多谢！
数据科学猫：数据预处理之数据分箱(Binning)
小白dong: 最后不显示图像是为什么啊？
3.4.2数据标准化（一） - Z-Score标准化
Flynn1392: CSDN是越来越封闭了
4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix)
这都啥跟啥: 或者说，文章里出现的混淆矩阵默认一个前提：以猫为例(猪狗同理)，真猫都会被检测为猫猪狗中的一种，并且检测到的假猫只来自猪或者狗。这里忽略了背景问题：一是真猫没有被识别为猫猪狗，而当作背景漏检了；二是背景区域(非猫猪狗)也可能被检测为猫。所以想问一下：当背景作为一个类，而未被标注时，应该怎样计算ACC？
4.4.2分类模型评判指标（一） - 混淆矩阵(Confusion Matrix)
这都啥跟啥: 请问ACC的定义“分类模型所有判断正确的结果占总观测值的比重”中“观测值”的定义是什么？比如图片中目标检测场景：狗数真实值为10，模型认为有5只狗、2只猫、剩余3只认为不属于已知类别（相当于认为是背景），那这3只计入观测值吗？同理，牛数真实值为10，模型认为有12头牛，其中包含10头牛和2个背景（背景被误检测为牛），那这2个背景计入观测值吗？

最新文章

目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。