-- 按照汉字的字母排序
SELECT * from key_word s ORDER BY CONVERT(s.kywds_nm using gbk) asc;
-- 判断为纯数字
SELECT * from key_word s where LENGTH(s.KYWDS_NM +0) = LENGTH(s.KYWDS_NM) and s.KYWDS_NM regexp '^[0-9]';
-- 判断为全英文
SELECT * from key_word s where LENGTH(s.KYWDS_NM) = CHAR_LENGTH(s.KYWDS_NM) and not s.KYWDS_NM regexp '[0-9]';
-- 判断为全汉字
SELECT * from key_word s where LENGTH(s.KYWDS_NM) != CHAR_LENGTH(s.KYWDS_NM) and not s.KYWDS_NM regexp '[0-9]' and not s.KYWDS_NM REGEXP '[a-z]';
-- 判断包含汉字的
SELECT * from key_word s where LENGTH(s.KYWDS_NM) != CHAR_LENGTH(s.KYWDS_NM);
注意: 使用char_length 和length 进行长度对比的需要是utf8 , gbk 是对比不出来的。
Mysql支持 几十种字符集;应该如何选择呐,有以下可以参考:
- 如果需要支持各种语言,文字,或作发布使用不同语言或国家,mysql目前使用UTF-8;
- 需要考虑已有数据,如果已有数据,需要考虑字符集的兼容性,就是后来设置的字集要比之前使用的字集范围大;
- 如果只需要支持一般中文,并且数据量很大,性能要求很高,用gbk比较合适,因为gbk一个汉字占2个字符,utf8 占3个字符;满足需求的情况下gbk可以减少存储占用,提供检索效率;
- 如果只有少量汉字,主要处理英文 则建议选择UTF8;因为 utf8 英文只占一个字符;gbk英文占2个字符;所以会大大减少存储的大小;
- 如果客户端需要支持相同的字符集,则可以设置服务器级别的字符集: