因子是用于对数据进行分类并将其存储为级别的数据对象,它们可以存储字符串和整数,并且在具有有限数量的唯一值的列中很有用, 像“男”,“女”,“真”,“假”等。
一种在统计建模的数据分析中很有用,我们可以通过factor()
函数使用向量作为输入来创建因子,看下实例:
输出结果为:
我们在使用一列文本数据创建数据帧时,R将文本列视为分类数据并在其上创建因子,如下:
输出结果为:
我们还可以通过用新的级别顺序再次应用因子函数来改变因子中级别的顺序,如下:
输出结果为:
我们可以通过使用gl()
函数来生成因子级别。它需要两个整数作为输入,并且表示每个级别有多少级别和多少次,语法如下:
gl(n, k, labels)
参数描述如下:
- n - 是给出级别数的整数。
- k - 是给出复制次数的整数。
- labels - 是所得因子水平的标签向量。
实例如下:
输出结果为:
好啦,本次记录就到这里了。
如果感觉不错的话,请多多点赞支持哦。。。