Windows的R语言经常会遇到各种各样的中文乱码问题,从数据库读取数据时,直接读取csv数据时,进行文本分析莫名奇怪得不到想要的结果时。
读取数据时的中文乱码
从数据库中读取
当你已经把数据库的编码设置为Utf-8或者其他中文编码格式时,R语言中文读取出现乱码,有几个解决的方法。一是现对数据库和R进行设置在读取,以RODBC,RMysql读取数据库为例。 二 读取后对编码 编码进行设置 ,以实例说明。
RODBC连接Mysql为例
先配置ODBC-Mysql的中文格式,配置如下,再在读取时进行设置参数设置读取格式,这里设置为UTF8
###设置参数DBMSencoding为utf8 myconn <- odbcConnect(dsn=dsn, uid=uid, pwd=pwd, DBMSencoding="UTF8") ##连接数据库
Rmysql连接Mysql为例
Rmysql连接数据库出现乱码时,读取时先在R里对数据库中文编码进行设置