背景
今天白天在公司用R画图时,中文乱码很严重。R对中文的支持一向不是很好,所以搜集了一下资料,写在博客里备份。
MAC
读入含有中文的文本数据时,不管是read.table还是read.csv,都需要指定编码方式。通常情况下,中文的编码方式是GBK,所以需要指定fileEncoding = ‘GBK’。(不使用encoding来指定的原因见参考链接1)
WINDOWS
不指定编码方式时,WINDOWS默认为GBK。指定fileEncoding = ‘utf-8’,其他同上。
修改已导入的文件
一个有用的函数是Encoding。具体用法如下:
Encoding(x) <- value
# x是一个character vector
# value是你想选择的编码方式
# 以下是一个例子
Encoding(data) <- 'UTF-8'
# UTF-8对大小写敏感