mysql字符集

http://www.linux-centos.com/2013/08/06/mysql%E5%AD%97%E7%AC%A6%E9%9B%86/#mysql-3


常用字符集比较

字符集是否定长编码方式说明
ASCII单字节7位编码最早的奠基性字符集
ISO-8859-1/latin单字节8位编码西欧字符集经常被用来转码
GB 2312-80双字节编码早期标准,不推荐再使用
GBK双字节编码虽然不是国标,但支持的系统不少
GB 180302字节或4字节编码开始有一些支持,但是数据库支持的还少见
UTF-324字节编码USC-4原始编码,目前较少采用
USC-22字节编码Windows2000内部用USC-2
UTF-162字节或4字节编码JAVA和windows xp/nt内部使用UTF-16
UTF-81~4字节编码互联网和UNIX/LINUX广泛支持的UNICODE字符集;mysql server也使用UTF-8

如何选择合适的字符集

  • 满足应用支持的语言要求,如果应用要处理各种各样的文字,或者将发布到使用不同语言的国家。就应该使用Unicode字符集。对mysql来说,现在就是UTF-8
  • 应用中如果涉及到数据导入,就需要考虑数据库字符集对已有数据的兼容性。假如已有数据是GBK文字,如把需要导入的数据的字符集设置为GB 2313-80,就很可能出现某些文字无法正确导入。
  • 如果数据库只需要支持一般中文,数据量很大,对性能要求较高,那就应该选择双字节定长编码的字符集,比如GBK。因为对于UTF-8而言,GBK比较小,每个汉字只占2个字节,而UTF-8汉字编码需要3个字节,这样可以减少磁盘IO、数据库cache,以及网络传输的时间,从而提高性能。相反,如果应用主要处理英文字符,仅有少量汉字数据,那应该选择UTF-8会更好,因为GBK、USC-2、UTF-16的西文字符编码都是两个字节,会造成不必要的开销

mysql的字符集简介

同一台服务器、同一个数据库甚至同一个表的不同字段都可以指定使用不同的字符集。

mysql的字符集包括字符集(CHARACTER)和校对规则(COLLATION)两个概念。字符集是用来定义MYSQL存储字符串的方式,校对规则是定义了比较字符串的方式。

每个字符集至少对应一个校对规则。可用show collcation命令查看

校对规则命名约定:他们以其相关的字符集名开始,通常包括一个语言名,并且以ci(大小写不敏感),_cs(大小写敏感)或_bin(二元,即比较是基于字符编码的值而与language无关)结束。

mysql字符集的设置

mysql字符集和校对规则支持四个级别的默认设置:服务器级、数据库级、表级和字段级。他们分别在不同的地方设置,作用也不相同。

服务器级字符集和校对规则

如果没有指定服务器字符集,默认会使用latin1作为服务器字符集。上面三种方式只是指定了字符集,没有指定校对规则,所以会使用该字符集的默认校对规则,如果要使用该字符集的非默认校对规则,需要在指定字符集的同时指定校对规则。

数据库字符集和校对规则

需要注意,如果数据库里已经存在数据,因为修改字符集不能将已有的数据按照新的字符集进行存放,所以不能通过直接修改数据库的字符集直接修改数据内容。所以在创建数据库的时候最好明确指定字符集和校对规则,避免收到默认值的影响。

表字符集和校对规则

同样,如果表中已有数据,修改字符集对原有记录并没有影响,不会按照新的字符集进行存放。表的字段仍然使用原来的字符集。所以最好在创建表的时候也指定好字符集和校对规则。

列字符集和校对规则

连接字符集和校对规则

mysql字符集的修改步骤


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值