我试图从R中获取MySQL数据库中的UTF-8文本。我在OS X上运行R(通过GUI和命令行进行),默认语言环境是en_US.UTF-8,而没有关于我的尝试,查询结果显示“?”对于所有非ASCII字符。
在通过ODBC连接时,我尝试设置选项(encoding =’UTF-8′),DBMSencoding =’UTF-8’,在获取结果之后设置编码(res $ str)< - 'UTF-8'作为这些的“utf8”变体,都无济于事。从命令行运行查询mysql客户端正确显示结果。 我完全被骗了任何想法为什么它不工作,或其他事情我应该尝试? 这是一个相当小的测试用例:
$ mysql -u root
mysql> CREATE DATABASE test;
mysql> USE test;
mysql> CREATE TABLE test (str VARCHAR(10)) ENGINE=InnoDB DEFAULT CHARSET=utf8;
Query OK, 0 rows affected (0.02 sec)
mysql> INSERT INTO test (str) VALUES ('こんにちは');
Query OK, 1 row affected (0.00 sec)
mysql> select * from test;
+-----------------+
| str |
+-----------------+
| こんにちは |
+-----------------+
1 row in set (0.00 sec)
使用RODBC和RMySQL查询R中的表格显示“???”对于str列:
> con
> sqlQuery(con, 'SELECT * FROM rtest.test')
str
1 ?????
> library(RMySQL)
Loading required package: DBI
> con
> dbGetQuery(con, 'SELECT * FROM rtest.test')
str
1 ?????
为了完整,这里是我的sessionInfo:
> sessionInfo()
R version 2.15.1 (2012-06-22)
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] RMySQL_0.9-3 DBI_0.2-5 RODBC_1.3-6