最近在导入R中含中文的csv文件时会出现这样的报错:
#出错代码示例
data1=read.table("C:\\Users\\86151\\Desktop\\PCAscore.csv",
header=TRUE)
#运行结果:
> data1=read.table("C:\\Users\\86151\\Desktop\\PCAscore.csv",
+ header=TRUE)
Error in make.names(col.names, unique = TRUE) :
invalid multibyte string at '<d6><de>,<ca>'
出错的主要原因是文件编码问题,下面直接给出解决方法参考,两步即可:
第一步、选中所要导入的目标csv文件,右击,选择打开方式为记事本
可以在窗口右下角发现其编码格式为“ANSI”
第二步、“文件”—“另存为”—“编码”—“utf-8”—“保存”
保存后可以发现其右下角编码格式显示为“utf—8”
再次运行原本的代码:
#代码示例
data1=read.table("C:\\Users\\86151\\Desktop\\PCAscore.csv",
header=TRUE)
data1
#运行结果:
> data1
洲.市场.商店大小.成本预算
1 -0.061,-0.003,-0.083,0.21
2 0.408,0.397,0.39,0.03
3 0.144,0.214,0.175,0.052
4 -0.384,0.213,0.003,0.009
5 0.367,-0.945,0.442,-0.003
6 0.365,0.082,-0.299,0.052
此时即可正常导入。