在数据分析过程中,增加新变量和修改现有变量是常见且重要的任务。R语言中的dplyr扩展包提供了强大的工具来简化这些操作。本节将详细介绍如何使用dplyr包的mutate()函数增加新变量,以及如何对数据集中的现有变量进行赋值修改。
一、增加新变量
1、使用mutate()函数创建新变量
在数据分析的过程中,常常需要基于现有变量创建新的派生变量。例如,我们可以基于iris
数据集中的两个变量Petal.Length
和Petal.Width
,创建一个新的变量Pe.Ratio
,其值为Petal.Length
与Petal.Width
的比值。
# 加载dplyr包
library(dplyr)
# 创建新变量Pe.Ratio
iris.2 <- mutate(iris, Pe.Ratio = Petal.Length / Petal.Width)
# 查看前两行数据
head(iris.2