MySql中的字符集和怎样选择字符集

 字符集概述
字符集是一套符号和编码的规则,不论是在oracle数据库还是在mysql数据库,都
存在字符集的选择问题,而且如果在数据库创建阶段没有正确选择字符集,那么可能在后期
需要更换字符集,而字符集的更换是代价比较高的操作,也存在一定的风险,所以,我们推
荐在应用开始阶段,就按照需求正确的选择合适的字符集,避免后期不必要的调整。
www.163.com
网易技术部 17
4.2 Mysql支持的字符集简介
mysql服务器可以支持多种字符集(可以用show character set命令查看所有mysql支持
的字符集),在同一台服务器、同一个数据库、甚至同一个表的不同字段都可以指定使用不
同的字符集,相比oracle等其他数据库管理系统,在同一个数据库只能使用相同的字符集,
mysql明显存在更大的灵活性。
mysql的字符集包括字符集(CHARACTER)和校对规则(COLLATION)两个概念。字符集
是用来定义mysql存储字符串的方式,校对规则则是定义了比较字符串的方式。字符集和校
对规则是一对多的关系, MySQL支持30多种字符集的70多种校对规则。
每个字符集至少对应一个校对规则。可以用SHOW COLLATION LIKE 'utf8%';命令查看相
关字符集的校对规则。
4.3 Unicode简述
Unicode是一种编码规范。我们在这里简述一下Unicode编码产生的历史。
先从ASCII码说起,ASCII码也是一种编码规范,只不过ASCII码只能最多表示256
个字符,是针对英文产生的,而面对中文、阿拉伯文之类的复杂文字,256个字符显然是不
够用的。于是各个国家或组织都相继制定了符合自己语言文字的标准,比如gb2312、big5
等等。但是这种各自制定自己的标准的做法显然是有很多弊端的,于是Unicode编码规范应
运而生。
Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言
文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set",
简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。
Unicode有两套标准UCS-2和UCS-4,前者用2个字节表示一个字符,后者用4个字节
表示一个字符。以目前常用的UCS-2为例,它可以表示的字符数为2^16=65535,基本上可
以容纳所有的欧美字符和绝大多数亚洲字符。
4.4 怎样选择合适的字符集
我们建议在能够完全满足应用的前提下,尽量使用小的字符集。因为更小的字符集意
www.163.com
网易技术部 18
味着能够节省空间、减少网络传输字节数,同时由于存储空间的较小间接的提高了系统的性
能。
有很多字符集可以保存汉字,比如utf8、gb2312、gbk、latin1等等,但是常用的是
gb2312和gbk。因为gb2312字库比gbk字库小,有些偏僻字(例如:洺)不能保存,因此
在选择字符集的时候一定要权衡这些偏僻字在应用出现的几率以及造成的影响,不能做出肯
定答复的话最好选用gbk。
4.5 Mysql字符集的设置
mysql的字符集和校对规则有4个级别的默认设置:服务器级、数据库级、表级和字段
级。分别在不同的地方设置,作用也不相同。
服务器字符集和校对,在mysql服务启动的时候确定。
可以在my.cnf中设置:
[mysqld]
default-character-set=utf8
或者在启动选项中指定:
mysqld --default-character-set=utf8
或者在编译的时候指定:
./configure --with-charset=utf8
如果没有特别的指定服务器字符集,默认使用latin1作为服务器字符集。上面三种设
置的方式都只指定了字符集,没有指定校对规则,这样是使用该字符集默认的校对规则,如
果要使用该字符集的非默认校对规则,则需要在指定字符集的同时指定校对规则。
可以用show variables like 'character_set_server';命令查询当前服务器的字符
集和校对规则。
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值