mysql优化介绍2_mysql 字段结尾匹配效率-CSDN博客

本文详细介绍了正则表达式的使用方法，包括各种符号的含义及应用场景，并通过MySQL示例展示其匹配功能。此外，文章还探讨了数据库优化策略，如数据类型优化、表拆分、逆规范化等技术，以及如何使用中间表提高统计查询效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

正则表达式

是用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。

序列	序列说明
^	在字符串开始处进行匹配
$	在字符串结尾进行匹配
.	匹配任意单个字符，包括换行符
[…]	匹配中括号的任意字符
[^…]	匹配不在中括号任意字符
a*	匹配零个或多个a 包括空串
a+	匹配一个或多个a 不包括空串
a?	匹配零个或一个a
a1\|a2	匹配a1或a2
a(m)	匹配m个a
a(m,)	匹配m个a或更多a
a(m,n)	匹配m到n个a
a(,n)	匹配零个或n个a
(….)	将多个元素组成一个整体

1.使用^匹配是否以a开头

mysql> select 'abcdefg' regexp '^a';
+-----------------------+
| 'abcdefg' regexp '^a' |
+-----------------------+
|                     1 |
+-----------------------+
1 row in set (0.00 sec)

2.使用$匹配是否以g结尾

mysql> select  'abcdefg' regexp 'g$';
+-----------------------+
| 'abcdefg' regexp 'g$' |
+-----------------------+
|                     1 |
+-----------------------+
1 row in set (0.00 sec)

3.使用.匹配单个字符

mysql> select 'abcedfg' regexp '.h' ,'abcdefg' regexp '.f';
+-----------------------+-----------------------+
| 'abcedfg' regexp '.h' | 'abcdefg' regexp '.f' |
+-----------------------+-----------------------+
|                     0 |                     1 |
+-----------------------+-----------------------+
1 row in set (0.00 sec)

4.[..]匹配是否符合里面的任意字符

mysql> select 'abcdefg' regexp "[cd]";
+-------------------------+
| 'abcdefg' regexp "[cd]" |
+-------------------------+
|                       1 |
+-------------------------+
1 row in set (0.00 sec)

5.[^..]匹配不符合里面的任意字符

mysql> select  'abcdefg' regexp "[^xyz]" ,'x' regexp "[^xyz]"

+---------------------------+---------------------+
| 'abcdefg' regexp "[^xyz]" | 'x' regexp "[^xyz]" |
+---------------------------+---------------------+
|                         1 |                   0 |
+---------------------------+---------------------+
1 row in set (0.00 sec)

使用rand()提取随机行

可以利用order by 子句完成随机抽取某些行的功能，他的原理就是order by rand()能够数据随机排序。

mysql> select  *  from category order by rand() limit 5;
+-------------+-----------+---------------------+
| category_id | name      | last_update         |
+-------------+-----------+---------------------+
|          15 | Sports    | 2006-02-15 04:46:27 |
|           2 | Animation | 2006-02-15 04:46:27 |
|           5 | Comedy    | 2006-02-15 04:46:27 |
|          14 | Sci-Fi    | 2006-02-15 04:46:27 |
|           9 | Foreign   | 2006-02-15 04:46:27 |
+-------------+-----------+---------------------+
5 rows in set (0.00 sec)

使用group by 的with rollup

使用group by 的with rollup 子句可以检索更多分组聚合的信息，不仅仅获取group by 检索的聚合信息，还能够检索本组类的整体聚合信息。

没有使用with rollup情况，

mysql> select cid,parent_cid,sum(sort_order) from nb_dim_item_cat group by cid,parent_cid limit 5;
+--------+------------+-----------------+
| cid    | parent_cid | sum(sort_order) |
+--------+------------+-----------------+
| 11     | 0          |              31 |
| 1101   | 0          |              29 |
| 110201 | 11         |               8 |
| 110202 | 11         |               5 |
| 110203 | 11         |               4 |
+--------+------------+-----------------+
5 rows in set (0.18 sec)

下面是有使用with rollup，明显可以看到多出的信息

mysql> select cid,parent_cid,sum(sort_order) from nb_dim_item_cat group by cid,parent_cid with rollup limit 6;
+--------+------------+-----------------+
| cid    | parent_cid | sum(sort_order) |
+--------+------------+-----------------+
| 11     | 0          |              31 |
| 11     | NULL       |              31 |
| 1101   | 0          |              29 |
| 1101   | NULL       |              29 |
| 110201 | 11         |               8 |
| 110201 | NULL       |               8 |
+--------+------------+-----------------+
6 rows in set (0.79 sec)

优化数据库对象

优化表的数据类型

在mysql中可以使用procedure analyse()对当前表进行分析，该函数可以对数据库表的数据类型提出优化建议，用户可以根据实际情况是否进行优化

mysql> select *  from  film procedure analyse()\G
*************************** 1. row ***************************
             Field_name: sakila.film.film_id
              Min_value: 1
              Max_value: 1000
             Min_length: 1
             Max_length: 4
       Empties_or_zeros: 0
                  Nulls: 0
Avg_value_or_avg_length: 500.5000
                    Std: 288.6750
      Optimal_fieldtype: SMALLINT(4) UNSIGNED NOT NULL

从结果可以看到，film_id 列的Min_value,Max_value,Min_length,Max_length,根据这些统计值，可以对列做出优化，同时也给出了优化建议 optimal_fileldtype.

拆分表提高标的访问效率

拆分是指对数据表进行拆分，做过针对MyISAM类型的表进行，那么有两种拆分方式

1.垂直拆分，

即把主列和其他一些列放到一个表，然后把主类和另外的列放到一个表，如果一个表中一些列常用，而另一些列不常用，则可以进行垂直拆分，垂直拆分是的数据行变小，一个数据也就能够存放更多的数据，减少了I/O次数，但是管理冗余，查询所有需要join操作

2.水平拆分

根据一个列或多个列把数据放到独立的表，通常有以下几种情况。