理解R语言中的factor

转载和整理自,向作者表示感谢

1.http://blog.csdn.net/yeweiyangblog/article/details/52838579
2.http://www.dengfeilong.com/post/factor.html

在R语言中,因子(factor)表示的是一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4……那么因子就包括,1,2,3,4…..还有描述协变量水平时,会用到高、中、低,也是因子,因为这些都是一个点。与之区别的向量,是一个连续性的值,例如,数值中有1,1.1,1.2……可以作为数值来计算,而因子则不可以。简单通俗来讲:因子是一个点,向量是一个有方向的范围。在R中,如果把数字作为因子,那么在导入数据之后,需要将向量转换为因子(factor),而因子在整个计算过程中不再作为数值,而是一个”符号”而已。

以实例进行解释和说明

data <- c(1,2,2,3,1,2,3,3,1,2,3,3,1)  
> data
 [1] 1 2 2 3 1 2 3 3 1 2 3 3 1 

> fdata <- factor(data)
> fdata
 [1] 1 2 2 3 1 2 3 3 1 2 3 3 1
Levels: 1 2 3

> class(fdata)
[1] "factor"
> class(data)
[1] "numeric"

#factor()函数将原来的数值型的向量转化为了factor类型。factor类型的向量中有Levels的概念。Levels就是factor中的所有元素的集合(没有重复)。我们可以发现Levels就是factor中元素排除重复后且字符化的结果。因为Levels的元素都是character。

> levels(fdata)
[1] "1" "2" "3"

#我们可以在factor生成时,通过labels向量来指定levels,继续上面的程序:

> rdata <- factor(data,labels=c("I","II","III"))
> rdata
 [1] I   II  II  III I   II  III III I   II  III III I  
Levels: I II III

> rdata <- factor(data,labels=c("e","ee","eee"))
> rdata
 [1] e   ee  ee  eee e   ee  eee eee e   ee  eee eee e  
Levels: e ee eee

#factors可以指定数据的顺序

> mons <- c("March","April","January","November","January", "September","October","September","November","August", "January","November","November","February","May","August", "July","December","August","August","September","November", "February","April")
> mons <- factor(mons)
> mons
 [1] March     April     January   November  January  
 [6] September October   September November  August   
[11] January   November  November  February  May      
[16] August    July      December  August    August   
[21] September November  February  April    
11 Levels: April August December February ... September

> table(mons)
mons
    April    August  December  February   January 
        2         4         1         2         3 
     July     March       May  November   October 
        1         1         1         5         1 
September 
        3 

#显然月份是有顺序的,我们可以为factor指定顺序
mons = factor(mons,levels=c("January","February","March","April","May","June","July","August","September","October","November","December"),ordered=TRUE)

> table(mons)
mons
  January  February     March     April       May 
        3         2         1         2         1 
     June      July    August September   October 
        0         1         4         3         1 
 November  December 
        5         1 
  • 40
    点赞
  • 128
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
R语言,将Factor类型转换为numeric类型可以使用as.numeric()函数。具体的操作步骤如下: 1. 首先,找到你想要转换的Factor变量,假设它的名字是factor_var。 2. 使用as.numeric()函数将Factor转换为numeric类型,并将结果赋给一个新的变量,比如num_var。代码如下:num_var <- as.numeric(factor_var)。 3. 现在,你可以使用num_var来代替原来的Factor变量,进行其他计算或数据处理的操作。 需要注意的是,转换过程可能会出现一些警告或错误信息,这可能是因为转换过程存在缺失值或无效的数据。在处理这些警告或错误时,你可以根据具体情况进行调整和处理。 请注意,Factor类型转换为numeric类型可能会导致数据的精度或准确性的损失。因此,在进行转换之前,请确保你理解数据的含义和可能的影响。 综上所述,要将R语言的Factor类型转换为numeric类型,可以使用as.numeric()函数来实现。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Coursera系列-R Programming (John Hopkins University)-Programming Assignment 3](https://blog.csdn.net/weixin_30881367/article/details/95653238)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值