现在utf-8编码方式应用越来越广泛,主要是原因应该受到当前国际化理念的驱动,像Wordpress就是完全用utf-8编码编码格式。在我一 次面试的时候遇到了相关问题,所以现在正在转向用utf-8编码。在刚开始的使用的时候,经常遇到各种编码问题,为了便于以后参考,在这里将一些要点罗列 一下。
1. MySQL数据库
MySQL(版本是5.1.22)支持多种编码格式,并且可以在多个级别上设置不同的编码格式。
- 服务器级:在安装MySQL时可以设置服务器的默认编码格式
- 数据库级:在创建数据库时可以指定数据库的编码格式,如果不指定,则默认继承服务器的编码格式。示例如下:
CREATE DATABASE db_name DEFAULT CHARACTER SET utf8;
- 表级:在MySQL中可以对同一个数据库中表指定不同的编码格式,如果不指定将继承数据库的编码格式。示例如下:
CREATE TABLE `db_name`.`tb_name` ( id VARCHAR(20) NOT NULL, name VARCHAR(20) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
- 列级:另外还可以对同一个表中的不同列指定不同的编码格式,示例如下:
CREATE TABLE `db_name`.`tb_name` ( id varchar(20) NOT NULL, name varchar(20) CHARACTER SET utf8 );
关于MySQL支持字符集的更多信息,可以参考MySQL用户手册第九章Character Set Support。MySQL用户手册有在线版本,也有CHM版本,在Windows上安装MySQL时,会附带CHM版本。
示例如下:
CREATE TABLE IF NOT EXISTS `#@__member_snsmsg` (
`id` INT( 10 ) UNSIGNED NOT NULL AUTO_INCREMENT ,
`mid` MEDIUMINT( 8 ) UNSIGNED DEFAULT '0' NOT NULL ,
`userid` VARCHAR( 20 ) NOT NULL ,
`sendtime` INT( 10 ) UNSIGNED DEFAULT '0' NOT NULL ,
`msg` VARCHAR( 250 ) NOT NULL ,
PRIMARY KEY ( `id` )
) TYPE=MyISAM;
指定编码
CREATE TABLE IF NOT EXISTS `#@__member_snsmsg` (
`id` INT( 10 ) UNSIGNED NOT NULL AUTO_INCREMENT ,
`mid` MEDIUMINT( 8 ) UNSIGNED DEFAULT '0' NOT NULL ,
`userid` VARCHAR( 20 ) NOT NULL ,
`sendtime` INT( 10 ) UNSIGNED DEFAULT '0' NOT NULL ,
`msg` VARCHAR( 250 ) NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE=MyISAM DEFAULT CHARSET=utf8;