正北偏南 ^_^

天外有天,人上有人,山水之间有神灵!

把DH主机上的mysql字符集倒腾为utf8

转贴:http://groups.google.com/group/fwolf-blog/msg/d3028249e819c1f8

很久没有倒腾过mysql的字符集了,都疏忽了,以致于为LP安装Dreamhost上主机的时候,居然没有修改mysql数据库的字符集。也是由于mysql

这东西,即使字符集设置错了,也是吃啥吐啥,拿错误的字符集就往数据库里存,所以外面根本看不出来。今天给LP写了个自动备份脚本,才发现导出的sql中全是乱码,岂能容忍?遂解决之~

首先还是放松了警惕,走了个弯路,我习惯使用的dump脚本是:

mysqldump --add-drop-table --default-character-set=utf8 -h
mysql.mydomain.com --user=fwolf --password=mypasswd
--extended-insert=false fwolf_db > mydomain.com_db.sql

可是dump出来的sql一看中文全是乱码,于是去掉--default-character-set=utf8
再dump,数据依旧,一时没想过来,用iconv把dump出来的sql左转换右转换怎么也是不对,后来才想明白,DH上mysql字符集的默认设置是这样的:

mysql> show variables where variable_name like 'char%';
+--------------------------+--------------------------------------------+
| Variable_name            | Value                                      |
+--------------------------+--------------------------------------------+
| character_set_client     | latin1                                     |
| character_set_connection | latin1                                     |
| character_set_database   | latin1                                       |
| character_set_filesystem | binary                                     |
| character_set_results    | latin1                                     |
| character_set_server     | latin1                                     |
| character_set_system     | utf8                                       |
| character_sets_dir       | /data/mysql/ovadilla/share/mysql/charsets/ |
+--------------------------+--------------------------------------------+
8 rows in set (0.00 sec)

数据库服务器字符集是latin1,也就是mysql默认的latin1_swedish_ci,而系统的默认字符集则是utf8,所以不带
--default-character-set=utf8
参数dump的数据的时候,其实和带上这个参数是一样的!想通这个问题,又知道了mysql吃啥吐啥的特性之后,解决方法就简单了,记住如果WordPress和mysql都是默认设置的情况下,如果你能夠正常浏览中文,则说明配置就是错误的,因为WordPress默认也不是utf8字符集的。

首先,按latin1字符集导出sql:

mysqldump --add-drop-table --default-character-set=latin1 -h
mysql.mydomain.com --user=fwolf --password=mypasswd
--extended-insert=false fwolf_db > mydomain.com_db.sql

这样导出的sql中的中文应该都是正确的了,现在修改导出的sql文件,把其中的latin1全部替换为utf8,然后再重新导入数据库,导入的时候强制指定字符集为utf8:

mysql --default-character-set=utf8 fwolf_db -h mysql.mydomain.com -u
fwolf -pmypasswd < mydomain.com_db.sql

这样,如果直接用mysql查询数据的话,如果不使用set names 'utf8'
,中文应该是乱码的,而如果你的数据库字符集仍然是默认的latin1的话,会是相反的情况:不使用set names 'utf8'
,中文正常,使用之后反而乱码。确认数据库字符集调整正确之后,再来搞定WordPress,这个就简单多了,编辑文件WP/wp-includes/wp-
db.php,大概66行,在$this->select($dbname);前面,加上:

$this->query('set names utf8');

这样就全部搞定了,数据库和Wordpress的字符集全部调整为万国码utf8。

参考:

   - 搬往 dreamhost 中文变乱码<http://joyus.org/blog/2006/07/move-to-dreamhost.html>
   - PHP 存取 MySQL 乱码问题 <http://9458398.cn/tag/%E4%B9%B1%E7%A0%81+sql/>
   - MySQL 的数据库转换问题 <https://dream4ever.org/archive/t-149238.html>
   - MySQL 內 latin1 編碼儲存的 utf8 編碼資料轉 utf8
編碼儲存<http://phpbb-tw.net/phpbb/viewtopic.php?t=47299>

PS1: DH主机ssh、svn、cron、php-cli、fsocketopen什么的全部支持,太爽了,怪不得那么多人喜爱,就是ssh的速度慢了些。

PS2:
一个和mysql吃啥吐啥有关的笑话,不太雅:你来到医院,向医生说:我近来很不正常,吃什么拉什么,吃黄豆拉黄豆,吃西瓜拉西瓜,你问医生怎样才能恢复正常,医生沉默了一阵说:你吃屎吧!

Source:http://www.fwolf.com/blog/post/310
阅读更多
个人分类: 转帖
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭