R语言解决MongoDB中文编码问题

R语言的中文支持不好,采用的编码方式常常优先考虑西方语言,http://developer.r-project.org/Encodings_and_R.html中有介绍


而MongoDB中储存的中文采用的是UTF-8格式编码,因此

p <- mongo.find.all(mongo,ns)
temp<-unlist(p[1,2]);

读出的数据temp中,中文无法显示操作



将中文改变编码格式的函数是

Encoding(temp)<-"UTF-8";

此时的temp就是可以正常显示的了


搜索MongoDB中的字符串的时候,想find一个中文字符串,可以考虑先将中文从GB2312转到utf-8,搜索后,再转回来,转为utf-8的方法是:

queryString<-"求回复";
#编码转换
data3=iconv(queryString, from='GB2312', to='utf-8')
#搜索
buf <- mongo.bson.buffer.create()
mongo.bson.buffer.append(buf, "content", queryString)
query <- mongo.bson.from.buffer(buf)  
mongo.find.one(mongo, ns, query)





  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值