1.Subset函数
功能:从某一个数据集中选择出符合条件的数据和相关的列。
格式:subset(a,b,select=),
参数:
- a表示选中的数据集。
- b代表条件判断式。
- select后指定想要输出的属性列。
2. Split()函数
功能:可以按照分组因子,把向量,矩阵和数据框进行适当的分组,它的返回值是一个列表,代表分组变量每个水平的观测。
格式 :split(x, f, drop = FALSE, …)
参数:
- x为待分组的数据集。
- f为函数。
- drop为逻辑值,为true时,若f中的某一个level没有用上则被弃用。
3. Sample()函数
功能:随机抽取出数据集中的数据。
格式:sample(x, size, replace = FALSE)
参数:
- x代表数据集的整体,即为抽样的总体。
- size为抽样大小。
- replace代表是否允许重复抽样。
4. Set.seed()函数
功能:定义一个种子,使其后所跟随的函数值始终保持不变,常与sample()函数搭配使用。
格式:set.seed(x)
参数:
- x可以为任意数字,不会参与运算,只是一个标识。
5. 数据排序函数
- sort()函数
- rank()函数
- order()函数
注:具体使用方法参见前文“R语言——数据排序”
6. paste()函数
功能:将它的参数转换为字符串并连接他们,字符串之间用seq间隔分开。
格式:paste(a,b,seq=“”,collapse = NULL)
参数:
- a为各字符变量的固定字符,可省略不写。
- b为要组合的任意数量的参数。
- seq表示各参数之间的分隔符。
- collapse用于消除两个字符串之间的空间。但不是在一个字符串的两个词的空间。