scale()函数详解

最新推荐文章于 2024-10-04 20:50:17 发布

kylin王国

最新推荐文章于 2024-10-04 20:50:17 发布

阅读量1.5k

点赞数 5

文章标签：学习

本文链接：https://blog.csdn.net/weixin_47634487/article/details/139865247

版权

scale()函数是R语言中用于标准化和中心化数据的一个函数。这个函数通常用于数据预处理，以便于后续的分析和建模。下面是对scale()函数的详细介绍：

用法

scale(x, center = TRUE, scale = TRUE)

参数

x: 一个数值型向量、矩阵或数据框，是需要进行标准化或中心化处理的数据。
center: 一个逻辑值或数值向量。如果为TRUE（默认），则对数据进行中心化处理（减去均值）。如果为一个数值向量，则该向量的长度必须与列数相同，每一列的数据将减去该向量中的对应值。
scale: 一个逻辑值或数值向量。如果为TRUE（默认），则对数据进行标准化处理（除以标准差）。如果为一个数值向量，则该向量的长度必须与列数相同，每一列的数据将除以该向量中的对应值。

返回值

scale()函数返回一个与输入x具有相同维度的对象，其值经过标准化和/或中心化处理。返回值的属性包含中心化和标准化所用的值。

示例

向量的标准化

x <- c(1, 2, 3, 4, 5)
scaled_x <- scale(x)
print(scaled_x)
# 中心化处理（减去均值），标准化处理（除以标准差）

矩阵的标准化

m <- matrix(1:9, nrow = 3)
scaled_m <- scale(m)
print(scaled_m)
# 每一列都进行了中心化和标准化处理

仅进行中心化处理

x <- c(1, 2, 3, 4, 5)
centered_x <- scale(x, center = TRUE, scale = FALSE)
print(centered_x)
# 仅减去均值

仅进行标准化处理

x <- c(1, 2, 3, 4, 5)
scaled_x <- scale(x, center = FALSE, scale = TRUE)
print(scaled_x)
# 仅除以标准差

自定义中心化和标准化值

m <- matrix(1:9, nrow = 3)
center <- c(2, 3, 4)
scale_values <- c(1, 2, 3)
custom_scaled_m <- scale(m, center = center, scale = scale_values)
print(custom_scaled_m)
# 使用自定义的中心化和标准化值