在数据集中,列变量中常常会有缺失值、离群值等异常值,我们需要快速查找这些异常值;
在进行数据可视化时,有时也需要按数据大小排序,然后进行绘图。
这时就需要用到行排序,按数据的升序、降序排列可以快速找到一列数值的极值。
dplyr包是数据处理很强大的一个包,包中的arrange()函数可以对数据进行排序。
1. 数据准备
1.1 创建数据集
创建三个向量,并生成一个简单数据集。
x1 1,2), times = 4) # 生成一列重复数字c(1,2)4次的向量
x2 8, mean = 2, sd = 2) # 生成一列均值为2,标准差为2的数字向量
x3 1,6,8,4,NA,6,7,NA) # 向量中有2个缺失值
newdata # 生成数据框
newdata # 查看数据框
1.2 数据准备
install.packages("dplyr") # 安装包
library(dplyr) # 加载包
mydata # 转换数据集类型
mydata