R语言数据预处理

数据预处理函数

 数据修改
修改数据标签
行列删除    例如data[-1,-3]:表示删除数据集data的第一行和第三行
缺失值处理:
判断是否缺失
判断缺失模式

在有缺失数据的情况下进行的数据分析是不可能的,处理缺失数据主要有三种方法:
删除缺失样本:前提是缺失数据的比例比较少,而且确实数据是随机出现的,这样删除缺失数据后对分析结果影响不大,R可以使用complete.cases()指令选取完整的记录,有缺失值得行则删去不要
对于有多个变量缺失的数据,如果直接删除所有的缺失值,可以通过na.comit()函数来完成,一些函数在计算时可以通过参数设置来忽略缺失值
替换缺失值:用赋值来解决,用变量均值或者中位数来代替缺失值,
多重插补法:用来填补复杂数据缺失值的一种方法,通过变量间的关系来预测缺失数据,插补算法有JM模型(对原始数据的要求很高)和FSC(基于链式方程的),

demo(graphics)
demo(persp):绘制三维图形的例子

R作图的对象是向量或数据框,读入数据时一般可以直接形成图形


缺失值一般用NA表示
is.na(x) :看x当中有哪些值是空值,对x中的每个元素进行判断,如果是空值则返回TRUE,否则返回FALSE
缺失值不能用来比较的 ,不能用来比较相等
针对空值所做的运算都是NA,因为空值是不能比较的
 y <- sum(x,na.rm = TRUE)  //将x中的空值删除
na.omit() : 将有空值的那一行全部删除】

日期值:
 Sys.Date():返回系统当前日期
date():还有时间点

类型转换
> a <- c(2,5,7)
> a
[1] 2 5 7
> is.numeric()
Error in is.numeric() :
  0 arguments passed to 'is.numeric' which requires 1
> is.numeric(a)
[1] TRUE
> is.vector(a)
[1] TRUE
> b <- as.character(a)          //强制类型转化

在R中排序
order:默认以升序的方式进行排序
survey[order(survey$gender,survey$age),] :先按照性别进行排序,然后再按照年龄进行排序
降序排序:
survey[order(-survey$age),] :降序排序



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值