![2f413a806fa4a7db85811532ac9da94d.png](https://i-blog.csdnimg.cn/blog_migrate/5c804457b066a548cafbef85f0fc7b45.jpeg)
PostgreSQL 初探
PostgreSQL 是我们经常选择的数据库之一。它不仅仅是关系型数据库,同时也添加了对JSON数据的支持、全文检索功能,以及其他扩展。
2020 年 2月的总排名为第四名,关系型数据库中排名第四名。排名信息参考:DB-Engines
![685f71e6b52a08b781a8727561b573f8.png](https://i-blog.csdnimg.cn/blog_migrate/e3bf812581521c9a744429796670d2dd.jpeg)
![72e067a46a0bca8b5def0f996368ccdc.png](https://i-blog.csdnimg.cn/blog_migrate/7ce52f1ce693c46148b80458cf5e292a.jpeg)
为了更好地应用的工作中,针对 PostgreSQL 给我造成的疑惑整理了如下内容:
(1) PostgreSQL 版本之间的主要区别
(2) PostgreSQL 支持的数据类型
(3) PostgreSQL 存储引擎Heap介绍
(4) 围绕 JSON/JSONB 的全文检索功能以及 12.x 中的 JSON/JSONB Path
1, PostgreSQL
版本之间的主要区别
2020 年 2 月当我们访问 PostgreSQL 官网的时候,通过看到多个 Release 版本,应该怎么选择呢?
![cd617bd6283dd94871ae56793e8b9939.png](https://i-blog.csdnimg.cn/blog_migrate/c2b119bacf3c1f59c098c12c75dae51a.jpeg)
PostgreSQL 9.x 版本在 2020 年 2 月的版本是计划中的左右一个 release 版本,所以翻阅了 PostgreSQL 的相关文档后,整理了从 10.X,11.X,12.X 这三个版本的信息。如下图:
![6d61483787d14fa2b231bb23aa0e126c.png](https://i-blog.csdnimg.cn/blog_migrate/de4dd850fc1e1a263f99a3a8c7281df6.jpeg)
通过上面的版本我们发现,给开发人员带来的变化不大,这里列出了 4 项,开发人员经常关注的技术点:
(1)当前支持的数据类型
(2)存储引擎 Heap 具体的特性
(3)围绕 JSON/JSONB 的全文检索功能以及 12.x 中的 JSON/JSONB Path
所以下文将主要研究上面是 4 个技术点。
这里使用了一个 12.2 版本的 PostgreSQL 的 Docker 镜像:
docker pull postgre:12.2
如果对其他版本感兴趣可以访问[Docker hub](https://hub.docker.com/_/postgres?tab=tags) 启动 Postgre
docker run -e POSTGRES_PASSWORD=123456 -p 5432:5432 --name potgre12 postgres:12.2
其中的 -e POSTGRES_PASSWORD=123456
是设置 superuser 用户的密码,superuser 的默认 username 是 postgres.
PS:如果不想通过密码访问也可以通过 POSTGRES_HOST_AUTH_METHOD=trust
来允许不需要密码访问。
安装 psql 客户端(如果你还是用其他客户端可以跳过该步骤)
brew install libpq
连接 postgreSQL
psql -h 127.0.0.1 -p 5432 -U postgres --passsword
2,PostgreSQL 支持数据类型
PostgreSQL 中支持多种数据类型。如下图
![1ba8d98c6c9e96dce830a4d3b0e3d527.png](https://i-blog.csdnimg.cn/blog_migrate/51037e5b2d72d60eae5efe8dd576c159.jpeg)
3,PostgreSQL 存储引擎 Heap 具体特性
PostgreSQL 的存储引擎 Heap 和 MySQL 的 InnoDB 都完全遵循ACID,使用的是行级锁。
4,围绕 JSON/JSONB 的全文检索功能以及 12.x 中的 JSON/JSONB Path
JSON 和 JSONB 的区别在于:
(1) JSON 类型以 JSON 格式存储文本数据,在查询的时候需要先做内容解析,然后进行查询。所以写入快、查询慢。
(2)JSONB 类型以 JSON 格式的二进制形式存储数据,在插入的时候需要做文本解析,查询的时候并不需要做解析,因此写入慢,查询快。
而对 JSON/JSONB 涉及到内容包括,下面的内容对对一条数据的一个简单例子:建表、新建数据、查询、模糊查询、数据更新。
(1)建表
create table boy (
id int primary key not null,
name char(30) not null,
information jsonb
);
(2)新建数据
insert into boy (id, name, information) values (1,'Page', '{"age":18}');
insert into boy (id, name, information) values (2,'Aaron', '{"age":18}');
insert into boy (id, name, information) values (3,'Join', '{"age":18, "address":"beijing dongchengqu"}');
(3)查询
# 从 9.4 版本只是的通过 操作符 来查询 age 等于 18 的 student
select * from boy where (information->>'age')::int=18;
# 从 9.4 版本只是的通过 操作符 来查询 address 中以 beijing 开头的 students
select * from boy where (information->>'address')::text like 'beijing%';
# 12.x版本支持的 JSON/JSONB Path 方式查询 age 等于 18 的 student
select jsonb_path_query(information, '$.age ? (@==18)') from boy;
# 12.x版本支持的 JSON/JSONB Path 方式查询 address 中以 beijing 开头的 students
select jsonb_path_query(information, '$.address ? (@ starts with "beijing")') from boy;
通过上面的代码不难发现,PostgreSQL 12 中提供的 JSON function 非常好用。更多查询语句可以参考: 官网 json functions
(4)模糊查询(全文检索)
经过尝试默认条件下 PostgreSQL 提供的分词器对中文分词并不好。所以下面将演示英文的全文检索
新建表
create table technical (
id int primary key not null,
name tsvector
);
其中 tsvector 的数据类型是是分词器类型。可以执行 select 'hello page'::tsvector;
来查看分词结果。
插入数据
insert into technical (id, name) values (1, 'Test Driven Development'), (2, 'Test Driven Design'), (3, 'Behave Driven Development');
当搜索关键词 Test和Driven
时应该是显示 2 条结果;
select * from technical where name@@'Test & Driven';
总结:
通过上面的几个特性的分析,不难发现 PostgreSQL 提供了强大的功能和函数,上手之前还是需要对其中的函数有个大致的了解。
参考
(1) PostgreSQL 中文网