MySQL还支持线性散列,这与常规散列的不同之处在于,线性散列使用线性二乘幂算法,而常规散列则使用散列函数值的模数。
从语法上讲,线性哈希分区和常规哈希之间的唯一区别是LINEAR在PARTITION BY子句中添加了 关键字,如下所示:
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT,
store_id INT
)
PARTITION BY LINEAR HASH( YEAR(hired) )
PARTITIONS 4;
给定一个表达式expr,使用线性哈希处理时存储记录的分区是分区中的分区号N,其中的num分区 号N是根据以下算法得出的:
找到大于2的下一个幂 num。我们把这个值 V; 可以计算为:
V = POWER(2, CEILING(LOG(2, num)))
(假定num为13。 LOG(2,13)则为3.7004397181411。 CEILING(3.7004397181411)为4,V= = POWER(2,4)为16。)
设置N= F(column_list)&(V-1)
而N> = num:
设置V= V/ 2
设置N= N&(V--1)
假设t1使用以下语句创建使用线性哈希分区并具有6个分区的表:
CREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE)
PARTITION BY LINEAR HASH( YEAR(col3) )
PARTITIONS 6;
现在,假设您要插入两个记录以使其 t1具有col3 列值'2003-04-14'和 '1998-10-19'。其中第一个的分区号确定如下:
V = POWER(2, CEILING( LOG(2,6) )) = 8
N = YEAR('2003-04-14') & (8 - 1)
= 2003 & 7
= 3
(3 >= 6 is FALSE: record stored in partition #3)
计算第二条记录所在的分区号,如下所示:
V = 8
N = YEAR('1998-10-19') & (8 - 1)
= 1998 & 7
= 6
(6 >= 6 is TRUE: additional step required)
N = 6 & ((8 / 2) - 1)
= 6 & 3
= 2
(2 >= 6 is FALSE: record stored in partition #2)
通过线性哈希进行分区的优势在于,分区的添加,删除,合并和拆分速度更快,这在处理包含大量数据(兆兆字节)的表时可能会很有用。缺点是,与使用常规哈希分区获得的分布相比,数据不太可能在分区之间均匀分布。