mysql中utf8编码中文字符长度问题

最新推荐文章于 2024-01-25 19:45:02 发布

ypb455360299

最新推荐文章于 2024-01-25 19:45:02 发布

阅读量1.4w

点赞数 1

分类专栏： MySQL 文章标签： mysql character 存储测试 database insert

MySQL 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

只适用mysql5.0以上的版本：
1.一个汉字占多少长度与编码有关：
         UTF－8：一个汉字＝3个字节
            GBK：一个汉字＝2个字节
2.varchar(n)表示n个字符，无论汉字和英文，Mysql都能存入n个字符，仅是实际字节长度有所区别
3.MySQL检查长度，可用SQL语言：
        select LENGTH(fieldname) from tablename 来查看

＝＝＝＝＝＝＝＝＝华丽丽分隔线，转载如下：＝＝＝＝＝＝＝＝＝＝
涉及到了字符长度问题,搜索了一下,几乎千篇一律, 所以决定自己测试一下,彻底弄清楚字符长度问题.
编码一律为 UTF-8 编码 :

先来测试一下 php 把一个汉字认作几个字节:

<?php
header(‘Content-Type:text/html;charset=UTF-8′);
$str=’我’;
echo strlen($str);
?>

输出 3 , 证明在 UTF-8编码下, 一个汉字被认作3个字节长度.

而如果我们用 php 多字节扩展函数 mb_strlen($str,’utf8′); 这个时候输出 1

下面来测试一下 mysql char 和 varchar 字节长度.

创建一个数据库 (txt) :
CREATE DATABASE IF NOT EXISTS txt DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
创建一个表 (test) :
create table test(txt_char char(2) null, txt_varchar varchar(2) null ) ENGINE=MyISAM
确认一下我们表的字符集: 确实是UTF8编码的.

插入两条记录:

INSERT INTO test(txt_char,txt_varchar) VALUES (‘abcdef’,'uvwxyz’) , (‘我是中国人’,'北京欢迎你’) ;
看看插入结果:

在看看查询结果:

证明 mysql 并不会对超过长度的字符报错,而是直接截断了.

并且 char(2) 和 varchar(2) 都能存储 2个汉字,或者是两个英文字符.
证明 mysql 的 char(n) 可以直接存储 n 个汉字. 而不是 n/3 个
mysql 屏蔽了具体的存储细节,而直接以实际字符的个数来决定 char存储的个数.
这里只是测试在UTF8编码下的,如果是GBK编码,可能不一样,没兴趣去测试那么多了.

下面看看终端输出:

看看 mysql 检测字符长度: length 和 char_length 输出:

LENGTH 输出的结果是字符实际长度的!
而 CHAR_LENGTH输出的则是屏蔽了字符存储细节,是实际的字符个数!

总结一下:
在涉及中文环境下的php+mysql组合,最好是用 mb_strlen来检测字符长度, 而在mysql 中,使用 CHAR_LENGTH来检测字符长度,这样能做到中英文统一处理.

utf8_general_ci 不区分大小写，这个你在注册用户名和邮箱的时候就要使用。

utf8_general_cs 区分大小写，如果用户名和邮箱用这个就会照成不良后果

utf8_bin: compare strings by the binary value of each character in the string 将字符串每个字符串用二进制数据编译存储。区分大小写，而且可以存二进制的内容

举例说明：

如果你的Sql查询语句： where first_name="Bob"
下面哪些字段内容会返回匹配：
'Bob' : utf8_bin, utf8_general_ci and utf8_general_cs
'B?b' : utf8_general_ci and utf8_general_cs 将?转为o
'B?B' : utf8_general_ci 不区分大小写

ypb455360299

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
mysql中utf8编码中文字符长度问题

只适用mysql5.0以上的版本： 1.一个汉字占多少长度与编码有关： UTF－8：一个汉字＝3个字节 GBK：一个汉字＝2个字节 2.varchar(n)表示n个字符，无论汉字和英文，Mysql都能存入n个字符，仅是实际字节长度有所区别 3.MySQL检查长度，可用SQL语言： select LENGTH(fieldna
复制链接

扫一扫