R语言数据框中变量重编码

重编码就是根据同一变量(或和其他变量)的现有值创建新值的过程。

  • 将一个连续变量修改为一组类别值;
    如将具体的年龄重编码为年轻,中年,老年。
  • 将误编码的值替换成为一个正确值;
  • 基于一组分数线创建一个表示及格/不及格的变量

要重编码数据,可以使用R中的一个或者多个逻辑运算符
逻辑运算符
逻辑运算后会返回TRUE 或者FALSE

重编码方法(举例说明):
对于名为mydata数据框:

> mydata
  x1 x2 sum mean
1  1  5   6    3
2  2  6   8    4
3  3  7  10    5
4  4  8  12    6

当sum 值小于7时为low,大于11时为high,否则为middle,创建range变量:

> mydata$range[mydata$sum>11]<-"high"
> mydata$range[mydata$sum>=7&mydata$sum<=11]<-"middle" 
> mydata$range[mydata$sum<7]<-"low"
 > mydata
  x1 x2 sum mean  range
1  1  5   6    3    low
2  2  6   8    4 middle
3  3  7  10    5 middle
4  4  8  12    6   high
  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值