数据清理 R语言

目录

1. R语言读excel文件

2.R格式 

3. #看数据集的格式

 


1. R语言读excel文件

1.       报错1: xlsx包没办法用

> library(xlsx)   #R语言使用xlsx包
载入需要的程辑包:rJava
Error: package or namespace load failed for ‘rJava’:
 loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
  调用: fun(libname, pkgname)
  错误: JAVA_HOME cannot be determined from the Registry
Error: 无法载入程辑包‘rJava’
In addition: Warning messages:
1: 程辑包‘xlsx’是用R版本3.4.3 来建造的 
2: 程辑包‘rJava’是用R版本3.4.4 来建造的 


> library(rJava)
Error: package or namespace load failed for ‘rJava’:
 loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
  调用: fun(libname, pkgname)
  错误: JAVA_HOME cannot be determined from the Registry
In addition: Warning message:
程辑包‘rJava’是用R版本3.4.4 来建造的 

   解决办法:用readxl包  可以参考博客【R语言读取Excel文件】 https://blog.csdn.net/cl1143015961/article/details/50035529

  对相关的包:RODBC、xlsx、openxlsx、gdata、readxl   进行了比较

2.R格式 

可以参考博客:http://blog.sina.com.cn/s/blog_6b36e6750100uad3.html

3. 看数据集的格式

      属于dplyr包  glimpse(BXdata)

结果:

4.  更改数据集列的格式

    从csv文件中导出来的每一列的属性都是factor,金额是每三位加一个逗号的格式。

BXdata[,1] = parse_date(BXdata[,1])  # 实现从factor转换为日期格式
BXdata[,5] = parse_number(BXdata[,5])  #实现从3,123,123.00这样的金额形式转化为double形式的数字

#可以用parse_character()将factor形式的文本转化为字符串格式,但是可能是encoding出了问题,最后结果会出现乱码,所以用as.charcter()这个函数。
BXdata[,3] =as.character(BXdata[,5])

最后,结果:

 

笔记:as.character(data[,1])这样如果出现问题,可以考虑用下面这个来代替,可能会成功。具体是因为什么还需要再看看。

 as.character(data$费用)   #费用是第一列的变量名。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值