在使用R语言读取数据或者R代码时,有时候会出现中文乱码的现象。如何才能避免此类乱码问题的出现呢,笔者根据自己在实际数据处理过程中的经验,总结如下:
笔者在Windows系统下,使用R软件进行统计分析相关事宜。相关代码仅供参考。
1、数据读取时,增加参数encoding="UTF-8"或者fileEncoding="UTF-8"(linux环境下);encoding="GBK"或者fileEncoding="GBK"(Windows环境下);
csv格式文件:
data<-read.csv("D:/data.xlsx",fileEncoding="UTF-8") #或者encoding="UTF-8"
txt格式文件:
data<-read.table("D:/data.txt",header=T,sep=",",fileEncoding="UTF-8") #或者encoding="UTF-8"
2、数据导出时,参数同数据导入;
write.csv(data,"D:/data.csv",fileEncoding="GBK")
write.table(data,"D:/data.txt",fileEncoding="GBK")
注:如果知道数据的编码格式,则在读取数据时,加上编码格式。fileEncoding有时候会比encoding更有效,推荐统一使用fileEncoding参数来设定编码格式。