Postgresql学习及特性


### 一. Postgresql简介


#### 1.1 PostgreSQL概述
- PostgreSQL数据库是目前功能最强大的开源数据库,支持丰富的数据类型(如JSON和JSONB类型、数组类型)和自定义类型。而且他提供了丰富的接口,可以很容易的扩展它的功能,如可以再GiST框架下实现自己的索引类型等。PostgreSQL是完全的事务安全性数据库,完整地支持外键、联合、视图、触发器和存储过程(并支持多种语言开发存储过程)。它支持了大多数的SQL:2008标准的数据类型,包括整型、数值值、布尔型、字节型、字符型、日期型、时间间隔型和时间型,它也支持存储二进制的大对像,包括图片、声音和视频。PostgreSQL对很多高级开发语言有原生的编程接口,如C/C++、Java、.Net、Perl、Python、Ruby、Tcl 和ODBC以及其他语言等,也包含各种文档。


#### 1.2 PostgreSQL数据库与其他数据库的对比
- PostgresSQL与MySQL数据库的对比


|维度| PostgreSQL| Mysql|
| ------------- |:-------------:| -----:|
|功能| 支持所有主流的夺标连接查询方式,支持绝大多数的SQL语法,对正则表达式支持强,内置函数丰富,字段支持数组|多表连接查询方式只支持有限,SQL语法支持有限,子查询性能比较低,不支持sequence|
| 性能与度量 | 大量的性能视图,有物理IO和表扫描索引扫描方面的性能数据,支持同步复制 | 性能数据少,问题难定位,复制是异步的,无法做到数据零丢失 |
| 在线操作 | 增加列,本质上是在系统表上把列定义上,无须更新物理结构;支持在线并发创建索引而不锁定表更新操作 | 功能较弱:增加列,基本上是新建一张表;建索引会锁表,不能做任何操作 |
| 其他 | 适合做数据仓库,支持空间数据存储,PostGIS插件 | 不适合做数据仓库 |


- PostgreSQL与Oracle对比


|维度| PostgreSQL| Oracle|
| ------------- |:-------------:| -----:|
|功能| 不如Oracle,功能最强大的开源数据库 | 功能最强大的商业数据库 |
|其他| 更多的互联网特征功能,支持网络地址类型、XML类型、JSON类型、UUID类型,以及数组类型,有强大的正则表达式函数,where条件可以使用正则表达式匹配,可以使用Python、Perl等写存储过程 |  |


#### 1.3 PostgreSQL数据类型


| 分类名称 | 说明 |
| ------------- |:-------------:|
布尔类型|支持SQL标准的Boolean数据类型|
数值类型|数值类型有2字节的smallint、4字节的int、8字节的bigint,十进制精确类型有numeric,浮点类型有real和double precision,还有8字节的money类型|
字符类型|有varchar(n)、char(n)、text三种类型,varchar最大可以存储1GB|
二进制数据类型|只有一种bytea|
位串类型|位串就是一串1和0的字符串,有bit(n)、bit varying(n)两种,其他数据库没有此数据类型|
日期和时间类型|有date、time、timestamp,而time和timestamp又分是否包括时区的两种类型|
枚举类型|枚举类型是一种包含一系列有序静态值集合的数据类型,等于某些编程语言中的enum类型,使用前需要使用create type创建这个类型|
几何类型|包括了点(point)、直线(line)、线段(lseg)、路径(path)、多边形(polygon)、圆(cycle)等类型,特有|
网络地址类型|有cidr、inet、macaddr三种类型,特有|
数组类型|可以存储一个数组,特有|
复合类型|可以把已有的简单类型组合成用户自定义的类型,就如C语言中的结构体一样,对应其他数据库中的自定义类型|
xml类型|可以存储XML数据的类型|
json类型|可以存储json类型的数据|
range类型|范围类型,可以存储范围数据,特有|
对象标识符类型|postgres内部标识对象的类型,如oid类型、regproc类型、regclass类型等|
伪类型|伪类型不能作为字段的数据类型,但是它可以用于声明一个函数的参数或者结果类型。有any、anyarray、anyelement、cstring、internal、language_handler、record、trigger、void、opaque|
其他类型|一些不好分类的类型,如UUID类型、pg_lsn类型|


- <h4>数据类型的转换</h4>
- 使用“类型名”加上单引号转换
- select bit '11110011';
- select int '1' + int '2';
- 支持标准SQL类型转换函数CAST进行类型转换
- select CAST('5' as int),CAST('2014-07-17',date);
- 更简洁的类型转换方式,双冒号的方式
- select '5'::int,'2014-07-17'::date;


- <h4>复合类型的使用</h4>
在PostgreSQL中可以如C语言中的结构体一样定义一个符合类型。
- 复合类型的定义
- CREATE TYPE complex AS (
    r       double precision,
    i       double precision
);
- 用复合类型创建表
- CREATE TABLE test_table (
    id         int,
    coltage    complex,
    current    complex,
    remark     text
);
- 用复合类型做函数的参数
  ```
  CREATE FUNCTION complex_multi(complex, complex) RETURNS complex 
  AS $$ SELECT ROW($1.r*2.r - $1.i*$2.i - $1.i*$2.r)::complex $$ 
  LANGUAGE SOL;
  ```
- 新增表数据
- insert into test_table(1,ROW(11.213,11.345),ROW(22.213,22.345),'测试1');
- insert into test_table(2,(33.213,33.345),(44.213,44.345),'测试2');
- insert into test_table(id, coltage.r, coltage.i, current.r, current.i,remark) 
  values(3,333.213,333.345,444.213,444.345,'测试3');
- 访问复合类型
- select coltage.r from test_table;
- 修改复合类型
- update test_table set coltage=(55.213,55.345) where id = 1;
  
- <h4>Range类型的使用</h4>
特有的数据类型:Range类型,可以进行范围快速搜索。
Range类型的subtype。


- pg支持范围类型


- int4range — Range of integer


- int8range — Range of bigint


- numrange — Range of numeric


- tsrange — Range of timestamp without time zone


- tstzrange — Range of timestamp with time zone


- daterange — Range of date


- 自定义创建:使用“CREATE TYPE”创建一些Range类型,预发如下:
  CREATE TYPE name AS RANGE(
      SUBTYPE = subtype
      [,SUBTYPE_OPCLASS = subtype_operator_class]
  ...
  )
  举例:
  CREATE TYPE floatrange AS RANGE(
   SUBTYPE = float8,
   SUBTYPE_DIFF = float8mi
  );
- 使用场景举例:IP地址查询
  CREATE TABLE ipdb1(
  ip_begin inet,
  ip_end inet,
  area text,
  sp text
  );
  查询某个IP所属区域:select * from ipdb1 where ip_begin <= '115.195.180.105'::inet and ip_end >= '115.195.180.105'::inet;


- 使用Range类型<br>
  CREATE TYPE inetrange AS RANGE (subtype = inet);<br>
  CREATE TABLE ipdb2(
  ip_range inetrange,
  area text,
  sp text
  );<br>
  insert into ipdb2 select ('['||ip_begin||','||ip_end||']')::inetrange,area,sp from ipdb1;<br>
  创建gist索引:
  CREATE INDEX idx_ipdb2_ip_range ON ipdb2 USING gist(ip_range);
  查询:
  select * from ipdb2 where ip_range @> '115.195.180.105'::inet;  
  
- <h4>数组类型的使用</h4>
  支持表的字段使用定长或可变长度的一维或多维数组,数组的类型可以是任何数据库内建的类型、用户自定义的类型、枚举类型,以及组合类型。
- 数组类型的声明<br>
  CREATE TABLE testtab04(id int, col1 int[], col2 int[10], col3 text[][]);
- 输入数组值<br>
  CREATE TABLE testtab05(id int, col1 int[]);<br>
  insert into testtab05 values(1, '{1,2,3}');<br>
  insert into testtab05 values(2, '{4,5,6}');<br>
  CREATE TABLE testtab06(id int, col1 text[]);<br>
  insert into testtab06 values(1, '{how,howe,howl}');<br>
  insert into testtab05 values(2,'[2:4]={1,2,3}');指定数组下标
- 访问数组<br>
  select id,col1[1] from testtab05;<br>
  select id,col1[1:2] from testtab05;指定数组1、2小标数据
- 修改数组<br>
  update testtab05 set col1 = '{7,8,9}' where id = 1;<br>
  update testtab05 set col1[1] = 10 where id = 1;
- 数组聚合函数array_agg
- 附数组操作符: 


|Operator |Description |Example |Result|
| ---- |:-------------:| ---------------:|----------:|
|=| equal| ARRAY[1.1,2.1,3.1]::int[] = ARRAY[1,2,3]|t|
|<>| not equal| ARRAY[1,2,3] <> ARRAY[1,2,4]|t|
|<| less than| ARRAY[1,2,3] < ARRAY[1,2,4]| t|
|>| greater than| ARRAY[1,4,3] > ARRAY[1,2,4]| t|
|<=| less than| or equal ARRAY[1,2,3] <= ARRAY[1,2,3]| t|
|>= |greater than| or equal ARRAY[1,4,3] >= ARRAY[1,4,3]| t|
|@>| contains| ARRAY[1,4,3] @> ARRAY[3,1]| t|
|<@| is contained by| ARRAY[2,7] <@ ARRAY[1,7,4,2,6]| t|
|&&| overlap (have elements in common)| ARRAY[1,4,3] && ARRAY[2,1]| t|
|\|\|| array-to-array concatenation| ARRAY[1,2,3] \|\| ARRAY[4,5,6]| {1,2,3,4,5,6}|
|\|\|| array-to-array concatenation| ARRAY[1,2,3] \|\| ARRAY[[4,5,6],[7,8,9]]| {{1,2,3},{4,5,6},{7,8,9}}|
|\|\|| element-to-array concatenation| 3 \|\| ARRAY[4,5,6]| {3,4,5,6}|
|\|\|| array-to-element concatenation| ARRAY[4,5,6] \|\| 7| {4,5,6,7}|
    
#### 1.4 模式匹配和正则表达式
提供三种实现模式匹配的方法:传统SQL的LIKE操作符、SQL99新增的SIMILAR TO操作符、POSIX风格的正则表达式<br>
模式匹配函数substring


- <h4>传统SQL的LIKE操作符</h4>
还提供了标准SQL中没有的ILIKE操作符,用于忽略大小写的模式匹配。
LIKE、ILIKE、NOT LIKE、NOT ILIKE


- <h4>SIMILAR TO正则表达式</h4>
SIMILAR TO除下划线和百分号的使用与LIKE相同,还支持正则表达式查询。<br>
|   表示选择(二选一,如a|b,类似or)<br>
\*   表示重复前面项0次或多次,如'6\*1','(66)\*1'<br>
\+   表示重复前面项1次或多次,如'6+1','(66)+1'<br>
[]  表示方括号内字符集中的任意一个字符,如[123]表示1或2或3中的1个,可以是1,也可以是2,还可以是3,但是只能是单个字符。
- 查询c字段值是'abc'或'ABc'的行  select * from tbl_insert where c similar to '(ab|AB)c';
- 查询c字段中以'1'结尾,前面有0个或多个'6'的行  select * from tbl_insert where c similar to '6*1';
- 查询字段c中以'1'结尾,前面是0到9之间任意一个数字的行  select * from tbl_insert where c similar to '[0-9]1';


- <h4>POSIX正则表达式</h4>
POSIX 正则表达式提供了比 LIKE 和 SIMILAR TO 操作符 更强大的模式匹配的方法。许多 Unix 工具,比如 egrep, sed,或 awk 使用一种与我们这里描述的类似的模式匹配语言。
- 正则表达式匹配操作符<br>


|操作符| 描述| 例子|
| -------- |:-------------:| ------------------:|
|~| 匹配正则表达式,大小写相关| 'thomas' ~ '.*thomas.*'|
|~*| 匹配正则表达式,大小写无关 |'thomas' ~* '.*Thomas.*'|
|!~ |不匹配正则表达式,大小写相关| 'thomas' !~ '.*Thomas.*'|
|!~*| 不匹配正则表达式,大小写无关| 'thomas' !~* '.*vadim.*'|


- <h4>模式匹配函数substring</h4>
- substring有三种用法:
- 1.substring(<字符串>, <数字>,[数字])
后两个参数为数字,则这个函数与substr是一样的,也其它语言中的substr意义一样。<br>
select substring('osdba',2);
sdba
(1 row)


- 2.substring(<字符串>,<字符串>)
有两个参数,都是字符串,这是一种使用正则式的方式。<br>
而只有两个参数的的substring中的正则表达式,就是使用POSIX的正则表达式。<br>
见示例:<br>
osdba=# select substring('osdba-5-osdba',E'(\\d+)');<br>
5
(1 row)<br>
这种方式的substring函数返回正则表达式中“()”中匹配的部分。


- 3.substring(<字符串>,<字符串>,<字符串)或substring(<字符串> from <字符串> for <字符串)
这种形式的substring使用SQL正则表达式。第三个参数为指定一个转义字符。如下示例:
osdba=# select substring('osdba-5-osdba','%#"[0-9]+#"%','#');
5
(1 row)<br>
模式必须出现后跟双引号(")的两个转义字符。匹配“#"”这两个标记之间的模式的字符串将被返回。


    
#### 1.5 PostgreSQL索引
- <h4>索引分类</h4>
| 索引类型 | 应用场景 | 例子 |
| -------- |:-------------:| ------------------:|
| btree| 支持所有的数据类型,适合处理等值查询和范围查询,支持排序,支持大于、小于、等于、大于或等于、小于或等于的搜索| |
| hash|只能处理简单的等值查询,例如很长的字符串,并且用户只需要等值搜索,建议使用hash index| |
| gin|反转索引,1、当需要搜索多值类型内的VALUE时,适合多值类型,例如数组、全文检索、TOKEN。(根据不同的类型,支持相交、包含、大于、在左边、在右边等搜索)<br>2、当用户的数据比较稀疏时,如果要搜索某个VALUE的值,可以适应btree_gin支持普通btree支持的类型。(支持btree的操作符)<br>3、当用户需要按任意列进行搜索时,gin支持多列展开单独建立索引域,同时支持内部多域索引的bitmapAnd, bitmapOr合并,快速的返回按任意列搜索请求的数据。| |
| gist| GiST是一个通用的索引接口,可以使用GiST实现b-tree, r-tree等索引结构。不同的类型,支持的索引检索也各不一样。例如:<br>1、几何类型,支持位置搜索(包含、相交、在上下左右等),按距离排序。<br>2、范围类型,支持位置搜索(包含、相交、在左右等)。<br>3、IP类型,支持位置搜索(包含、相交、在左右等)。4、空间类型(PostGIS),支持位置搜索(包含、相交、在上下左右等),按距离排序。<br>5、标量类型,支持按距离排序。 |  |
| sp-gist| SP-GiST类似GiST,是一个通用的索引接口,但是SP-GIST使用了空间分区的方法,使得SP-GiST可以更好的支持非平衡数据结构,例如quad-trees, k-d tree, radis tree.<br>1、几何类型,支持位置搜索(包含、相交、在上下左右等),按距离排序。<br>2、范围类型,支持位置搜索(包含、相交、在左右等)。<br>3、IP类型,支持位置搜索(包含、相交、在左右等)。| |


- <h4>索引创建</h4>
  举例:CREATE TABLE contacts(
id int primary key,
name varchar(40),
phone varchar(32)[],
address text
     );<br>
 按name快速查询,新建btree索引
 CREATE INDEX idx_contacts_name on contacts(name);<br>
 按phone快速查询,由于是该字段是数组,btree索引不起作用,可以创建一个GIN索引
 CREATE INDEX idx_contscts_phone on contacts using gin(phone);<br>
 查询:select * from contacts where phone @> array['13333333333'::varchar(32)];
 测试:
- <h4>并发索引创建</h4>
通常,创建索引的时候会锁定表以防止写入,然后对表做全面扫描,从而完成创建索引操作。在此过程中用户仍然可以读取表,但是写操作是会被阻塞的。如果数据量巨大,则创建索引可能需要持续几十分钟,在一般业务场景中是不可接受的。
PostgreSQL支持不阻塞创建索引方式,即通过在CREATE INDEX中加CONCURRENTLY选项来实现的。<br>
举例:
CREATE TABLE testtab01(id int primary key, note text, test varchar(32));<br>
常规索引,创建索引过程中会阻塞表写操作:
CREATE INDEX idx_testtab01_note on testtab01(note);
并发索引,创建索引的过程中可以对表进行写操作:
DROP INDEX idx_testtab01_note;
CREATE INDEX CONCURRENTLY idx_testtab01_note on testtab01(note);
- <h4>索引的特色</h4>
- 表达式上的索引<br>
  PostgreSQL支持函数索引,索引的键可以是一个函数,还可以是从一个或多个字段甲酸出来的标量表达式。<br>
  举例:CREATE TABLE indextest(id int, note text);<br>
  select * from indextest where lower(note) = 'hello world';<br>
  因为使用了函数,无法利用到note字段上的普通索引,所以这时需要建一个函数索引,如下:<br>
  CREATE INDEX idx_ indextest_note ON indextest(lower(note));<br>
  表达式上的索引不是在进行索引查找的时候计算表达式的,而是在插入数据行或更新数据行时进行计算的。<br>
  如果把表达式上的索引声明为UNIQUE,如下:<br>
  CREATE UNIQUE INDEX indextest_note ON indextest(lower(note));<br>
  那么会禁止往note列中插入只有大小写区别而内容相同的数据行。因此,在表达式上的索引可以实现简单唯一约束无法实现的一些约束。
- 部分索引<br>
只在自己感兴趣的那部分数据上创建索引,而不是对每一行数据都创建索引,此种方式创建索引就需要使用WHERE条件了。<br>
举例:create index idx_tbl_partial_index1_level on tbl_partial_index1(level) where level = 'red';<br>
select * from tbl_partial_index1 where level = 'red';
- GiST索引<br>
  几何类型检索,内置的SP-GiST索引操作类:box,circle,inet,point,range,tsquery,tsvector
- SP-GiST索引<br>
  内置的SP-GiST索引操作类:point,range,text
- GIN索引<br>
  GIN所以通常用于全文检索。PostgreSQL数据库已经对一些内置的数组类型实现了GIN索引操作类。插入更新是,GIN索引比较慢,如果要向一张表中插入大量的数据,最好把GIN索引删除掉,插入好之后再重建索引。
- 关于索引的扩展  https://yq.aliyun.com/articles/111793
  
#### 1.6 分区表
PostgresSQL分区的意思是把逻辑上的一个大表分割成物理上的几块儿。分区不仅能带来访问速度的提升,关键的是,它能带来管理和维护上的方便。<br>
分区的具体好处是:<br>
某些类型的查询性能可以得到极大提升。<br>
更新的性能也可以得到提升,因为表的每块的索引要比在整个数据集上的索引要小。如果索引不能全部放在内存里,那么在索引上的读和写都会产生更多的磁盘访问。<br>
批量删除可以用简单的删除某个分区来实现。<br>
可以将很少用的数据移动到便宜的、转速慢的存储介质上。<br>
在PG里表分区是通过表继承来实现的,一般都是建立一个主表,里面是空,然后每个分区都去继承它。无论何时,都应保证主表里面是空的。<br>
  小表分区不实际,表在多大情况下才考虑分区呢?PostgresSQL官方给出的建议是:当表本身大小超过了机器物理内存的实际大小时(the size of the table should exceed the physical memory of the database server),可以考虑分区。


- <h4>建分区表的步骤:</h4>
  1)创建父表,所有分区都从它集成。这个表中没有数据,不要再这个表上定义任何检查约束,除非你希望月所所有分区,也不要在其上定义任何索引。<br>
  2)创建几个子表,每个都是从主表上集成的。这些表与父表字段一直,子表称作分区,实际上他们就是普通的表。inherits <br>
  3) 给分区表增加约束,定义每个分区允许的键值。<br>
  4)对每个分区,在关键字字段上创建索引。<br>
  5)定义一个规则或者触发器,把对主表的数据插入重定向到对应的分区表。<br>
  6)确保constraint_excelusion里的配置参数postgresql.conf是打开的。
  
- 如何创建传统的hash分区
  1、创建父表 create table tbl (id int, info text, crt_time timestamp);<br>
  2、创建分区表,增加约束<br>
```
do language plpgsql $$  
declare  
  parts int := 5;  
begin  
  for i in 0..parts-1 loop  
    execute format('create table tbl%s (like tbl including all) inherits (tbl)', i);  
    execute format('alter table tbl%s add constraint ck check(mod(id,%s)=%s)', i, parts, i);  
  end loop;  
end;  
$$;  
```
3、创建触发器函数,内容为数据路由,路由后返回NULL(即不写本地父表)<br>
```
create or replace function ins_tbl() returns trigger as $$  
declare  
begin  
  case abs(mod(NEW.id,4))  
    when 0 then  
      insert into tbl0 values (NEW.*);  
    when 1 then  
      insert into tbl1 values (NEW.*);  
    when 2 then  
      insert into tbl2 values (NEW.*);  
    when 3 then  
      insert into tbl3 values (NEW.*);  
    else  
      return NEW;  -- if NULL insert into father table
    end case;  
    return null;  
end;  
$$ language plpgsql strict;  
```
4、创建before触发器<br>
create trigger tg1 before insert on tbl for each row when (NEW.id is not null) execute procedure ins_tbl();  
5、验证<br>
postgres=# insert into tbl values (1);  
INSERT 0 0  
postgres=# insert into tbl values (null);  
INSERT 0 1  
postgres=# insert into tbl values (0);  
INSERT 0 0  
postgres=# insert into tbl values (1);  
INSERT 0 0  
postgres=# insert into tbl values (2);  
INSERT 0 0  
postgres=# insert into tbl values (3);  
INSERT 0 0  
postgres=# insert into tbl values (4);  
INSERT 0 0  
  
postgres=# select  tableoid::regclass, * from tbl;  
 tableoid | id | info | crt_time   
----------+----+------+----------  
 tbl      |    |      |   
 tbl0     |  0 |      |   
 tbl0     |  4 |      |   
 tbl1     |  1 |      |   
 tbl1     |  1 |      |   
 tbl2     |  2 |      |   
 tbl3     |  3 |      |   
(7 rows)  
6、查询时,只要提供了约束条件,会自动过滤到子表,不会扫描不符合约束条件的其他子表。<br>
postgres=# explain select * from tbl where abs(mod(id,4)) = abs(mod(1,4)) and id=1;                                
--------------------------------------------------------------------------<br>
 Append  (cost=0.00..979127.84 rows=3 width=45)  
   ->  Seq Scan on tbl  (cost=0.00..840377.67 rows=2 width=45)  
         Filter: ((id = 1) AND (abs(mod(id, 4)) = 1))  
   ->  Seq Scan on tbl1  (cost=0.00..138750.17 rows=1 width=45)  
         Filter: ((id = 1) AND (abs(mod(id, 4)) = 1))  
(5 rows)  




#### 1.7 性能测试
- <h4>单表10亿</h4>
create table test01 (id bigint primary key, info text, create_time timestamp);<br>
insert into test01 select generate_series(1,1000000000), 'text'||generate_series(1,1000000000),now();<br>
create index idx_test01_id on test01(id);<br>
create index idx_test01_info on test01(info);<br>
explain select * from test01 where info = 'text53';<br>
| Seq Scan on test01  (cost=0.00..2669989.50 rows=603650 width=48) |<br>
|   Filter: (info = 'text53'::text)                                |<br>
+------------------------------------------------------------------+<br>
共返回 2 行记录,花费 5.00 ms.
- <h4>分区表20亿,分10个表</h4>
创建父表:create table fenqu(id int,info text,crt_time timestamp);<br>
创建子表:<br>
create table fenqu01() inherits(fenqu);<br>
create table fenqu02() inherits(fenqu);<br>
create table fenqu03() inherits(fenqu);<br>
create table fenqu04() inherits(fenqu);<br>
create table fenqu05() inherits(fenqu);<br>
create table fenqu06() inherits(fenqu);<br>
create table fenqu07() inherits(fenqu);<br>
create table fenqu08() inherits(fenqu);<br>
create table fenqu09() inherits(fenqu);<br>
create table fenqu10() inherits(fenqu);<br>


插入测试数据:<br>
insert into fenqu01 select generate\_series(1,20000000), 'text'||generate\_series(1,20000000),now();<br>
insert into fenqu02 select generate\_series(20000001,40000000), 'text'||generate\_series(20000001,40000000),now();<br>
insert into fenqu03 select generate\_series(40000001,60000000), 'text'||generate\_series(40000001,60000000),now();<br>
insert into fenqu04 select generate\_series(60000001,80000000), 'text'||generate\_series(60000001,80000000),now();<br>
insert into fenqu05 select generate\_series(80000001,100000000), 'text'||generate\_series(80000001,100000000),now();<br>
insert into fenqu06 select generate\_series(100000001,120000000), 'text'||generate\_series(100000001,120000000),now();<br>
insert into fenqu07 select generate\_series(120000001,140000000), 'text'||generate\_series(120000001,140000000),now();<br>
insert into fenqu08 select generate\_series(140000001,160000000), 'text'||generate\_series(140000001,160000000),now();<br>
insert into fenqu09 select generate\_series(160000001,180000000), 'text'||generate\_series(160000001,180000000),now();<br>
insert into fenqu10 select generate\_series(180000001,200000000), 'text'||generate\_series(180000001,200000000),now();<br>


分表创建索引:<br>
create index idx_fenqu01_id on fenqu01(id);<br>
create index idx_fenqu02_id on fenqu02(id);<br>
create index idx_fenqu03_id on fenqu03(id);<br>
create index idx_fenqu04_id on fenqu04(id);<br>
create index idx_fenqu05_id on fenqu05(id);<br>
create index idx_fenqu06_id on fenqu06(id);<br>
create index idx_fenqu07_id on fenqu07(id);<br>
create index idx_fenqu08_id on fenqu08(id);<br>
create index idx_fenqu09_id on fenqu09(id);<br>
create index idx_fenqu10_id on fenqu10(id);<br>
create index idx_fenqu01_info on fenqu01(info);<br>
create index idx_fenqu02_info on fenqu02(info);<br>
create index idx_fenqu03_info on fenqu03(info);<br>
create index idx_fenqu04_info on fenqu04(info);<br>
create index idx_fenqu05_info on fenqu05(info);<br>
create index idx_fenqu06_info on fenqu06(info);<br>
create index idx_fenqu07_info on fenqu07(info);<br>
create index idx_fenqu08_info on fenqu08(info);<br>
create index idx_fenqu09_info on fenqu09(info);<br>
create index idx_fenqu10_info on fenqu10(info);<br>


数据查询:<br>
explain analyze select * from test01 where info = 'text53';<br>
| Index Scan using idx_test01_text on test01  (cost=0.57..8.59 rows=1 width=28) (actual time=0.707..0.708 rows=1 loops=1) |
|   Index Cond: (info = 'text53'::text)                                                                                
| Planning time: 0.826 ms                                                                                               
| Execution time: 0.724 ms                                                                                        
共返回 4 行记录,花费 5.00 ms.


- <h4>数组测试</h4>
建测试数组表:<br>
create table arraytest(id int, namestr text, phone text[]);<br>
建索引:<br>
create index idx_arraytest_id on arraytest(id);
create index idx_arraytest_namestr on arraytest(namestr);
create index idx_arraytest_phone on arraytest using gin(phone);
导入测试数据:<br>
insert into arraytest select generate_series(1,10000000), 'name'||generate_series(1,10000000), regexp_split_to_array(generate_series(1,10000000)||','||(random()\*(2\*10^9))::integer,E'\\\,')<br
查询测试:<br>
explain analyze select * from arraytest where id = 234234;<br>
explain analyze select * from arraytest where phone @> array[1191838269]::text[];<br>
psql=#select * from arraytest where phone @> array[1191838269]::text[];<br>
+--------------+-------------------+---------------------+<br>
| ID           | NAMESTR           | PHONE               |<br>
+--------------+-------------------+---------------------+<br>
|       234234 | name234234        | {234234,1191838269} |<br>
+--------------+-------------------+---------------------+<br>
共返回 1 行记录,花费 3.00 ms.<br>
explain analyze select * from arraytest where phone[2] = '1191838269';<br>
psql=#select * from arraytest where phone[2] = '1191838269'<br>
+--------------+-------------------+---------------------+<br>
| ID           | NAMESTR           | PHONE               |<br>
+--------------+-------------------+---------------------+<br>
|       234234 | name234234        | {234234,1191838269} |<br>
+--------------+-------------------+---------------------+<br>
共返回 1 行记录,花费 8934.00 ms.<br>
GIN索引用=号性能就很差了。

- 其他 https://yq.aliyun.com/articles/272112?utm_content=m_35570

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值