zscore标准化步骤_z-score的标准化究竟怎么弄？

最新推荐文章于 2024-05-29 18:26:52 发布

weixin_39713335

最新推荐文章于 2024-05-29 18:26:52 发布

阅读量8.4k

点赞数 1

文章标签： zscore标准化步骤

本文链接：https://blog.csdn.net/weixin_39713335/article/details/112945913

版权

在学习「数据挖掘导论」的数据预处理时，里面谈到了变量变换，我联想到了在基因表达量分析时的常见操作，例如FPKM，TPM，CPM，log对数变换。比如说在文章里面会见到如下的描述

The size factor of each cell was computed using a pooling strategy implemented in the R function computeSumFactors. Normalized counts were then computed by dividing the counts for each cell by the size factor for that cell. A log2 transformation was applied to normalized counts.

变量转换有什么好处，需要注意些什么呢？「数据挖掘导论」讨论了两种重要的变量变换类型: 简单函数变换和规范化。

简单变换是使用一个简单数学函数分别作用于每一个值，例如log转换，求绝对值，求倒数等。统计学中，变量变换(例如log转换)常用于将不具有高斯(正态)分布的数据变换成具有高斯(正态)分布的数据。在数据挖掘领域可以用来进行数据压缩。这类变换需要我们了解数据在变化前后的后果，例如负数取倒数之后的大小关系会发生倒转。

标准化(standardization)或规范化(normalization)的目标是使整个值的集合具有特定的属性。使用这两个术语需要特别注意使用这两个词的上下文。书中提到"在数据挖掘界，这两个术语常常可互换，然而，在统计学中，术语规范化可能与使得变量正态化相混淆"。虽然从中文的角度来看，规范化和正态化明显不一样，但是从英文的角度看，正态分布翻译自normal distribution, 很容易从n

最低0.47元/天解锁文章

weixin_39713335

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
zscore标准化步骤_z-score的标准化究竟怎么弄？

在学习「数据挖掘导论」的数据预处理时，里面谈到了变量变换，我联想到了在基因表达量分析时的常见操作，例如FPKM，TPM，CPM，log对数变换。比如说在文章里面会见到如下的描述The size factor of each cell was computed using a pooling strategy implemented in the R function computeSumFacto...
复制链接

扫一扫