目录
1. R语言读excel文件
1. 报错1: xlsx包没办法用
> library(xlsx) #R语言使用xlsx包
载入需要的程辑包:rJava
Error: package or namespace load failed for ‘rJava’:
loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
调用: fun(libname, pkgname)
错误: JAVA_HOME cannot be determined from the Registry
Error: 无法载入程辑包‘rJava’
In addition: Warning messages:
1: 程辑包‘xlsx’是用R版本3.4.3 来建造的
2: 程辑包‘rJava’是用R版本3.4.4 来建造的
> library(rJava)
Error: package or namespace load failed for ‘rJava’:
loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
调用: fun(libname, pkgname)
错误: JAVA_HOME cannot be determined from the Registry
In addition: Warning message:
程辑包‘rJava’是用R版本3.4.4 来建造的
解决办法:用readxl包 可以参考博客【R语言读取Excel文件】 https://blog.csdn.net/cl1143015961/article/details/50035529
对相关的包:RODBC、xlsx、openxlsx、gdata、readxl 进行了比较
2.R格式
可以参考博客:http://blog.sina.com.cn/s/blog_6b36e6750100uad3.html
3. 看数据集的格式
属于dplyr包 glimpse(BXdata)
结果:
4. 更改数据集列的格式
从csv文件中导出来的每一列的属性都是factor,金额是每三位加一个逗号的格式。
BXdata[,1] = parse_date(BXdata[,1]) # 实现从factor转换为日期格式
BXdata[,5] = parse_number(BXdata[,5]) #实现从3,123,123.00这样的金额形式转化为double形式的数字
#可以用parse_character()将factor形式的文本转化为字符串格式,但是可能是encoding出了问题,最后结果会出现乱码,所以用as.charcter()这个函数。
BXdata[,3] =as.character(BXdata[,5])
最后,结果:
笔记:as.character(data[,1])这样如果出现问题,可以考虑用下面这个来代替,可能会成功。具体是因为什么还需要再看看。
as.character(data$费用) #费用是第一列的变量名。