使用show [global | session ] variables like '%char%' 可以分别查看当前会话的字符集和全局字符集,如果global和session都不写,默认是session
所具有的字符集有
<pre name="code" class="cpp">
character_set_client | 客户端来源数据使用的字符集
character_set_connection | 连接层字符集
character_set_database | 当前选中数据库的默认字符集
character_set_filesystem | 一般为 binary ,乱码与其无关
character_set_results | 查询结果字符集
character_set_server | 默认的内部操作字符集
character_set_system | 系统元数据(字段名等)字符集,该变量为只读,不能通过set修改
修改字符集方法:
set [global | session ] character_set_client = gbk // 设置全局,或者当前连接的客户端字符集,其他类推
通过修改配置文件修改字符集:
在/etc/my.cnf中进行修改,商用版的mysql的配置文件没有my.cnf的文件,但是有mycnf的一个目录,里面有配置文件可以配置
[mysqld]
default-character-set=gbk // 如果没有该句可以加上
但这种方式仅能修改 character_set_server 和 character_set_database 的值
set names
SET NAMES 'utf8';它相当于下面的三句指令:
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;
字符乱码
乱码的原因在于,传递和存入用的是某个字符集,然而查询结果,character_set_results却是另一个字符集,如此数据库会根据results的结果集的解码方式解码非该字符集的字符编码,从而出现乱码。
解决方法很简单,确保各个编码匹配,同为utf8或者gbk之类的都行,同时这些工作往往要在插入数据之前进行,以前插入的数据库,随后修改字符集往往是不能解决问题的。
细心的话会发现,通关过修改配置文件可以修改 character_set_server 和 character_set_database ,而后当我们每次运行前执行set names 会出现什么情况呢?
对,我们刚好设置了所有的字符集。
字符集的有效范围
字符集是有数据库级的,表级的,以及列级的。所以需要时刻注意自己的数据库的字符集,比如用show create table TABLENAME,可以查看表的字符集。
创建表的,范例
DROP TABLE IF EXISTS `file_type`;
CREATE TABLE file_type(
file_index DECIMAL(6, 0) NOT NULL DEFAULT 0,
file_desc VARCHAR(80) NOT NULL DEFAULT '',
file_ver CHAR(2) NOT NULL DEFAULT '',
file_tp CHAR(1) NOT NULL DEFAULT '',
event_id INTEGER NOT NULL DEFAULT 0,
rec_upd_usr_id CHAR(8) NOT NULL DEFAULT '',
rec_upd_ts TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
rec_crt_ts TIMESTAMP NOT NULL DEFAULT '0000-00-00 00:00:00',
CONSTRAINT `ind_ft_pk` PRIMARY KEY (file_index),
UNIQUE `ind_cuips_cft_nq` (file_desc)
)ENGINE=InnoDB DEFAULT CHARSET=gbk COLLATE=gbk_bin ;
注:设置存储引擎,设置默认字符集,校对集,每列not null 并设置default值