R 语言中文乱码问题

R 语言似乎在WINDOWS平台上对中文的支持不是特别好,似乎是3.1.2的一个BUG。

目前我研究出了一个临时解决方案,你可以将代码编写成一个函数,从而在调用的过程中不必如下繁琐:

1. 先将本地语言集转换成English 1252:

 Sys.setlocale(category="LC_ALL", locale = "English_United States.1252")

2. 将文件集以UTF-8的格式读入:

b<-read.csv(y,head=F,encoding="UTF-8",stringsAsFactor=F)

3.最后将本地语言集再转换成中文。 

Sys.setlocale("LC_CTYPE", "Chinese")

 

 

值得注意的是上例中文件以UNICODE的字符集的形式存在,似乎对ANSI的字符集却不会有问题。我也闹不明白什么问题。

 

转载于:https://www.cnblogs.com/kiddy/p/4350196.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值