mysql 索引汉字_MySQL优化索引及优化汉字模糊查询语句

最新推荐文章于 2023-04-17 18:33:08 发布

校里蛙

最新推荐文章于 2023-04-17 18:33:08 发布

阅读量274

点赞数

文章标签： mysql 索引汉字

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42357054/article/details/113202543

版权

转 http://blog.csdn.net/firstboy0513/article/details/6912632

利用MySQL这种关系型数据库来做索引，的确有些勉强了，也只能看情况来说了，有些简单的功能还是可以考虑的。

对于模糊查询语句，最不利的情况是要like '%key%'这样的查询，但是如果是like 'key%'这种情况，那么mysql的索引在些查询方式上还是可以优化的。

网上常见的是ASCII的英文字符优化，如下：

select corp_code, corp_corp from tb_Z_Corp where corp_code like '0008%';

举个例子来看看问题的来源吧：

先看一下要试验表的创建语句和结构，这是一个只包含股票代码和股票名称的数据表，主键为股票代码：

mysql> show create table tb_Z_Corp;

+-----------+-----------------------------------+

| Table | Create Table |

+-----------+-----------------------------------+

| tb_Z_Corp | CREATE TABLE `tb_Z_Corp` (

`corp_code` char(10) NOT NULL,

`corp_corp` varchar(60) NOT NULL,

PRIMARY KEY (`corp_code`),

KEY `idx_Z_Corp_corp_corp` (`corp_corp`)

) ENGINE=MyISAM DEFAULT CHARSET=utf8 |

+-----------+-----------------------------------+

mysql> desc tb_Z_Corp;

+---------------+-------------+------+-----+---------+-------+

| Field | Type | Null | Key | Default | Extra |

+---------------+-------------+------+-----+---------+-------+

| corp_code | char(10) | NO | PRI | | |

| corp_corp | varchar(60) | NO | MUL | | |

+---------------+-------------+------+-----+---------+-------+

表里面的数据举例如下(股票代码和股票名称)：

+-----------+--------------+

| corp_code | corp_corp |

+-----------+--------------+

| 000800 | 一汽轿车 |

| 000801 | 四川九洲 |

| 000802 | 北京旅游 |

| 000803 | 金宇车城 |

| 000805 | *ST炎黄 |

| 000806 | 银河科技 |

| 000807 | 云铝股份 |

| 000809 | 中汇医药 |

看一下要待优化的语句(一个英文、一个中文的)：

select corp_code, corp_corp from tb_Z_Corp where corp_code like '0008%';

select corp_code, corp_corp from tb_Z_Corp where corp_corp like '江%';

对于第一个待优化的SQL语句来说，比较简单，很多地方都介绍过怎样优化：

select corp_code, corp_corp from tb_Z_Corp where corp_code >= '0008' and corp_code

而对于第二个是中文字符，马上想到是加一个最大编码的汉字，这里数据库存储的是UTF-8格式存储，而汉字的编码为3字节，所以按其最大编码的规则应该是：

Unicode编码是从U+0800到U+FFFF先标记一下这16位：“zzzzyyyy yyxxxxxx”；

然后把这16位对应到UTF-8的编码：“1110zzzz 10yyyyyy 10xxxxxx”。

所以最大的3个字节的编码为“11101111 10111111 10111111”，也就是十六进制的“EFBFBF”。

在MySQL中，用x'EFBFBF'表明这里面是用16进制编码的字符串，所以我们优化后的语句应该是这样的：

select corp_code, corp_corp from tb_Z_Corp where corp_corp >= '江' and corp_corp

这样就达到了不用like语句比较表中的每一条记录，而直接使用索引快速检索。看，结果出来了：

+-----------+--------------+

| corp_code | corp_corp |

+-----------+--------------+

| 600750 | 江中药业 |

| 002226 | 江南化工 |

| 601199 | 江南水务 |

| 000519 | 江南红箭 |

| 600527 | 江南高纤 |

| 002061 | 江山化工 |

| 600389 | 江山股份 |

| 600212 | 江泉实业 |

| 002484 | 江海股份 |

| 000816 | 江淮动力 |

| 600418 | 江淮汽车 |

| 002176 | 江特电机 |

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mysql 索引汉字_MySQL优化索引及优化汉字模糊查询语句

转 http://blog.csdn.net/firstboy0513/article/details/6912632利用MySQL这种关系型数据库来做索引，的确有些勉强了，也只能看情况来说了，有些简单的功能还是可以考虑的。对于模糊查询语句，最不利的情况是要like '%key%'这样的查询，但是如果是like 'key%'这种情况，那么mysql的索引在些查询方式上还是可以优化的。网上常见的是A...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。