PostgreSQL 中的 JSON:彻底改变数据库中的数据灵活性

在这篇文章中,我们将介绍 PostgreSQL 对 JSON 对象的实现和处理方法。拥有一些 Linux、Postgres 和 JSON 方面的经验是必要的,因为我们不仅要介绍这些新功能,还要介绍如何实现它们。

本文使用在 Ubuntu 23.04 上运行的 PostgreSQL 16(开发版)编写。首先,我将简要回顾一下 JSON 的背景知识,然后继续介绍我们如何在 Postgres 中使用 JSON,最后介绍我们可以使用哪些有用的函数来与 JSON 对象进行交互。

#1 背景

JavaScript 对象表示法(JSON)是一种开放的标准文件格式,用于将信息存储在键值对中。它拥有一种轻量级且独立于语言的格式,既易于大家阅读,又易于机器生成和解析。它的主要优势以及为什么它在数据存储中变得如此普遍,是因为它在应用程序之间的无缝互操作性。这很适合 Web 应用程序,因为我们通常需要两个程序进行通信,并且每个程序可能使用不同的语言来实现。只要每个程序都有解析JSON文件的方法,无论另一个程序使用什么软件或硬件,它们都应该能够有效地进行通信。现在我们看到了 JSON 在数据存储方面有多棒,让我们看看如何将其作为 ou Postgres 数据库的一部分。

#2 使用JSON

PostgreSQL 有两种用于在表中存储 JSON 数据的数据类型,分别是json 和 jsonb。json 类型将 JSON 数据存储为字符串,因此在读回时,接收应用程序需要将文本转换回 JSON 对象。另一方面,jsonb 类型将 JSON 对象直接存储为其二进制表示形式。当我们将 JSON 对象存储为 jsonb 时,PostgreSQL 会将 JSON 类型映射到它自己的数据类型,这些数据类型来自 PostgreSQL 文档:

图片

这两种类型都接受几乎相同的输入。但是,由于其效率,大多数应用程序将从使用 jsonb 中受益更多。因此,我们的示例将主要侧重于使用 jsonb

要开始在 Postgres 中使用 JSON,我们首先必须创建一个表,其中包含类型为 JSON 的列:

# CREATE TABLE t1 (id int, data jsonb);

现在我们可以插入一些数据:

# INSERT INTO t1 VALUES (1, '{"a":1, "b":"hello", "c":{"d":"world","e":2},"arr":[1,2,3]}');

让我们看看这些数据是如何表示的:

# SELECT * FROM t1;
 id |                     data                      
----+-----------------------------------------------
  1 | {"a":1, "b":"hello", "c":{"d":"world","e":2},"arr":[1,2,3]}
(1 row)

PostgreSQL 不仅存储 JSON 对象,它还具有自己的函数,可用于与使用键、值对作为查询中的参数进行交互。让我们来看看如何做到这一点。

JSON Functions

#3 运营商

PostgreSQL 实现了用于从 JSON 对象访问元素的运算符。PostgreSQL 文档中总结了这些运算符:

图片

使用这些运算符,我们可以从之前插入的 JSON 对象中访问元素。这些运算符返回的值如下所示:

# SELECT data->'a' AS result FROM t1;
 result 
--------
 1
(1 row)

postgres=# SELECT data->'arr'->2 AS result FROM t1;
 result 
--------
 3
(1 row)

现在我们可以访问这些值,我们可以使用它们来查询表中的行。

# INSERT INTO t1 VALUES (1,'{"num":12,"arr":[1,2,3]}'),(2,'{"num":14,"arr":[4,5,6]}'),(3,'{"num":16,"arr":[7,8,9]}');
# SELECT data FROM t1 WHERE (data->'arr'->1)::integer >= 5;
          result          
--------------------------
 {"num":14,"arr":[4,5,6]}
 {"num":16,"arr":[7,8,9]}
(2 rows)

正如我们所看到的,只选择了“arr”键中第 2 个元素大于或等于 5 的行。

#4 下标

这些 JSON 对象还支持在 Postgres 中下标,就像在许多编程语言中一样。我们可以将上面的运算符转换为下标,如下所示:

# SELECT data FROM t1 WHERE (data['arr'][1])::integer >= 5;
             data              
-------------------------------
 {"arr": [4, 5, 6], "num": 14}
 {"arr": [7, 8, 9], "num": 16}
(2 rows)

和以前一样,我们也可以在 SELECT 语句中使用下标:

# SELECT data['num'] FROM t1 WHERE (data['arr'][1])::integer >= 5;
 data 
------
 14
 16
(2 rows)

对于有 JSON 经验的人来说,这种语法可能更熟悉。随意使用其中任何一个,因为它们的功能非常相似,接受键的文本输入和数组的整数索引。

#5 功能

PostgreSQL 还实现了更强大的函数,用于转换和检索 JSON 对象的大小、键和迭代器等信息。当然,和前面一样,所有这些函数都可以在查询内部使用,从而使 JSON 对象在数据库中更加强大。我们将在JSON函数示例中使用以下表模式和数据:

# CREATE TABLE myjson (id int, data jsonb);
# INSERT INTO myjson values(1,'{"mynum":1,"mytext":"hello","myarr":[1,2,3,4,5]}');

更多函数可以在 PostgreSQL 文档的表 9.41 中找到。我们将在这里简要介绍一些更常见的函数的子集。

array_to_json

将任何 SQL 值转换为 JSON 二进制类型。

SELECT to_jsonb (data['myarr']) from myjson;
    to_jsonb     
-----------------
 [1, 2, 3, 4, 5]
(1 row)

jsonb_array_length

返回 JSON 二进制数组中的元素数。

SELECT jsonb_array_length (data['myarr']) from myjson;
 jsonb_array_length 
--------------------
                  5
(1 row)

jsonb_each

将顶级 JSON 对象转换为键值对。

SELECT jsonb_each (data) from myjson;
        jsonb_each         
---------------------------
 (myarr,"[1, 2, 3, 4, 5]")
 (mynum,1)
 (mytext,"""hello""")

jsonb_object_keys

返回 JSON Binary 对象的键。

SELECT jsonb_object_keys (data) from myjson;
 jsonb_object_keys 
-------------------
 myarr
 mynum
 mytext
(3 rows)

#6 结论

在这篇博客中,我们了解了 PostgreSQL JSON 数据类型以及如何使用它来存储、访问和管理 JSON 对象。首先,我们简要介绍了 JSON 格式的背景及其在 Web 上的实用性。然后,我们研究了如何设置一个表来使用 JSON 数据类型,然后是我们可以访问它们的不同方法。最后,我们查看了 JSON 对象将有权访问的函数的一小部分,以及如何在实现查询中使用它们。

JSON 数据类型是一个非常灵活且可互操作的对象,可被大量 Web API 接口理解。如果您的数据库与任何类型的 Web 应用程序交互,请考虑如何使用 JSON 来简化应用程序之间的数据传递。

*引用

[1]“8.14. JSON Types.” PostgreSQL Documentation, The PostgreSQL Global Development Group, 9 Nov. 2023, www.postgresql.org/docs/current/datatype-json.html.

[2]“JSON Functions and Operators.” PostgreSQL Documentation, The PostgreSQL Global Development Group, 8 Nov. 2018, www.postgresql.org/docs/9.3/functions-json.html.

[3]“PostgreSQL JSON.” PostgreSQL JSON Tutorial, PostgreSQL Tutorial, www.postgresqltutorial.com/postgresql-tutorial/postgresql-json/. Accessed 12 Jan. 2024.

  • 19
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
无服务器数据库架构介绍全文共6页,当前为第1页。无服务器数据库架构介绍全文共6页,当前为第1页。 无服务器数据库架构介绍全文共6页,当前为第1页。 无服务器数据库架构介绍全文共6页,当前为第1页。 无服务器数据库架构介绍 无服务器数据库架构介绍全文共6页,当前为第2页。无服务器数据库架构介绍全文共6页,当前为第2页。本文你可以了解到多个知名的"无服务器"数据库产品以及它们的优缺点。 无服务器数据库架构介绍全文共6页,当前为第2页。 无服务器数据库架构介绍全文共6页,当前为第2页。 初识无服务器架构 无服务器架构是云计算的一种运行模型,其含义是由云服务商动态地管理计算资源的分布。我们宝贵的计算资源的消费者本质上讲是函数执行。如果你用基于函数运行所消耗的内存和执行时间(四舍五入到100ms为单位)来计费,AWS和Azure会带来极大的成本开销。AWS Lambda当前的价格是$0.00001667/GB-秒,而Azure function是$0.000016/GB-秒。了解这些数据之后你就可以预估成本上升的的速度。因为分配的内存量是可以在128MB-1.5GB之间可配置的,函数执行的具体花费会根据你配置的不同而不同。每100ms执行时间的开销其最大配置可能是基本配置(128MB)的12倍多。 无服务器计算(serverless)仍然是需要服务器的,这也是无服务器数据库的切入点。先了解自身的需求无疑会让你更加容易地选择合适的数据库服务,也更加容易地使用当今最先进的技术方案。 各种无服务器数据库 市面上已经有了多个知名的数据库服务,比如Azure Data Lake。(Azure是微软的公有云服务) Google Cloud Store 无服务器数据库架构介绍全文共6页,当前为第3页。无服务器数据库架构介绍全文共6页,当前为第3页。**Google Cloud Store**是一个面向文档的数据库方案,作为一个独立服务给Google App Engine提供数据库组件。Google还提供有一个Firebase服务,这项服务提供给客户两种支付方式:固定付费或者按量付费。而且Firebase也包含有一个层次化的数据库。 无服务器数据库架构介绍全文共6页,当前为第3页。 无服务器数据库架构介绍全文共6页,当前为第3页。 FaunaDB **FaunaDB**是全球分布式的最大的事务性数据库服务。它的技术是基于twitter。 Amazon Aurora Serverless Amazon Aurora Serverless 在2017年的最后一个季度发布了技术预览版。它有两个不同版本分别与MySQL和PostgreSQL兼容,但是它也与其他的知名数据库系统兼容,比如MariaDB, Oracle等。 Amazon Aurora serverless database是完全云端管理并可以自动扩展到64T的数据库存储。 DynamoDB Amazon还提供了另一个服务,DynamoDB, 是一个完全云端管理的数据库服务。它可以提供可预测的高速的性能且支持无缝扩展。使用DynamoDB创建数据库和表的操作变得相当简单直接,你可以存储和查询任意数量的数据,并且DynamoDB也能服务于任意量级的请求流量。 MongoDB 无服务器数据库架构介绍全文共6页,当前为第4页。无服务器数据库架构介绍全文共6页,当前为第4页。MongoDB虽然不是一个无服务器数据库,但是我们还是要提一下,因为它也有一个数据库即服务(Database as a Service)的产品,名字叫MongoDB Atlas。MongoDB是免费开源的,发行许可证是GNU Affero General Public License。MongoDB在存储数据JSON这样的文档数据)方面非常灵活,这样它每个文档的列都是不同的,而且数据结构也会随时间而变化。 无服务器数据库架构介绍全文共6页,当前为第4页。 无服务器数据库架构介绍全文共6页,当前为第4页。 我继续回来说MongoDB Atlas,它是一个DBaaS工具。它有很多特别强大的功能,比如自动化运维,你可以在几分钟内创建和部署集群并且保证你的集群宕机时间为0。它也提供基于角色的访问控制来对你的数据做保护。同时支持加密和网络隔离,当然还有认证服务。 MongoDB Atlas的另一个强大功能是它简化了垂直扩展和水平扩展操作,支持一键触发。你也可以跨多个区region来部署集群来提供更好的读性能和数据保证。这些集群是地理上分布式的,支持自愈,并且有优秀的容错性。MongoDB Atlas的持续性备份提供了基于时间点恢复和快照(可查询)的能力。搜索任何细节都十分轻松而且查看的性能是实时的。你可以自定义报警,优化的面板会突出显示关键的历
RethinkDB 设计用来存储 JSON 文档的分布式数据库,可通过简单操作实现多机分布式存储。支持表的联合和分组查询。什么是RethinkDB?RethinkDB 是从头打造的第一个开源、可扩展的JSON数据库,用于搭建实时网页。全新的访问模型颠覆了传统的数据库结构:开发者只需告诉RethinkDB,实时连 续地将查询更新结果推送到应用就可以了,不用每次都去poll一遍。RethinkDB的实时推送结构为搭建可扩展实时应用节省了大量时间精力。除了为实时应用提供了全新的设计之外,RethinkDB 还提供了一种灵活的查询语言、直观的操作和监控API,安装学习起来也非常容易。你可以查看这篇 Advancing the realtime web 得到更多RethinkDB计划的技术细节。什么时候RethinkDB是一个好的选择?当你的应用很大程度上有赖于数据的实时反馈时,RethinkDB 就会成为一个很棒的选择。“查询-响应”式的数据库访问模型在web上的确很有用,它可以直接映射到HTTP的“请求-响应”。而现代应用则需要将数据直接实时地传送到客户端。能够最大化得益于RethinkDB实时推送架构的例子包括:协作网站和移动应用数据流分析应用多人在线游戏实时交易场所设备联机举个例子:在协作设计一个app的时候,其一个用户改变了某个按钮的位置,服务器就必须在第一时间通知所有在完成同一项目的其他用户。网页浏览器 能够通过WebSockets和http持久连接来支持这一功能,但数据库系统要迎合实时需求仍然是一个大的工程难题。而RethinkDB作为第一个开 源、可扩展的数据库,就是特别为实时推送数据到应用而设计的。哪些人在用 RethinkDB?RethinkDB 的用户包括上百个科技创业公司、咨询工作室和世界五百强企业。这里是其的一些:Jive Software 和 Mediafly 使用RethinkDB搭建强大的响应式网页和移动应用Pristine.io 和 Narrative Clip 使用RethinkDB搭建用于设备连接的云架构Platzi 和 Workshape.io 使用RethinkDB进行实时分析CMUNE 和 NodeCraft 使用RethinkDB构建大规模可扩展多人游戏RethinkDB 拥有超过十万开发者的活跃社区和上百个来自世界各地的代码贡献者。RethinkDB是基于现有技术的吗?高效实现实时推送架构需要重新设计绝大部分的数据库成分,包括查询执行引擎、分布式系统、超高速缓存子系统和存储引擎。因为架构影响到每一个数据库 组成部分,RethinkDB不得不从C 开始一步步写起来。RethinkDB 是由数据库专家组成的团队花了五年时间做出来的,还得到了来自世界各地上百个代码贡献者的帮助。RethinkDB和realtime sync不同在哪里?和Firebase, PubNub 或者Pusher 这类实时同步API相比,RethinkDB主要不同在以下三个方面:首先,实时同步API是云服务,而RethinkDB 是开源项目。RethinkDB也有云端,可以通过我们的合作伙伴 Compose.io 和 Amazon AWS获得。它还可以部署在你自己的架构,没有任何限制。其次,同步实时API只局限于同步文档,而RethinkDB是一个有着更普遍应用范围的数据库系统。 在RethinkDB你可以运行任意query,包括table joins, subqueries, geospatial queries, aggregation, 还有map-reduce。实时同步服务有更多查询功能上的限制。最后,实时同步API的设计是直接从浏览器访问。这使得基本的app能够快速地跑起来,然而一旦app扩展了,灵活性就会受到限制。 RethinkDB的设计是从应用服务器进行访问,这一点上更像是传统的数据库。可能会要多花一点设置代码,但拥有足够的灵活性去适应应用的成熟。RethinkDB和MongoDB又不同在哪里?RethinkDB所基于的架构和MongoDB非常不同。开发者只需告诉RethinkDB,实时连续地将查询更新结果推送到应用就可以了,不用 每次都去poll一遍。你同样可以在RethinkDB上用传统的“查询-响应”范式来书写应用。然后在你开始为app添加实时功能时再去订阅实时数据 流。举个例子,这是你让RethinkDB查询一个文件时的命令:r.table('users').get('coffeemug').run()然后这是你从RethinkDB订阅更新流时用到的语句,在任何时候文档发生了变化就会推送:r.table('users').get('coffeemug').changes().run()RethinkDB的实时架构可以和MongoDB的oplog相提并论,但前者提供了更高层次的抽象。RethinkDB的数据流与查询计算引擎无缝整合,并允许你订阅查询结果的变化,而不仅仅是把数据复制过来。这种架构大幅度地减少了搭建实时app所需的时间和精力。除了实时推送架构,RethinkDB 还有许多胜过 MongoDB的地方:一种高级的查询语言,能够支持table joins, subqueries 和大规模并行式分布计算。融合了查询语言的操作和监控API,大幅度降低了RethinkDB扩展的难度。简洁美观的UI 易于复制转发,拥有在线文档支持和查询语言建议。可以看看这篇 technical comparison of RethinkDB and MongoDB 里面的评论比较立一些。想听听个人观点的,请看@coffeemug 的what makes RethinkDB different.什么时候RethinkDB是一个不好的选择?当你需要用到完整ACID支持或者更强大的架构实施,RethinkDB就不大好用了。在这种情况下你最好用一些传统的MySQL或者PostgreSQL数据库。如果你需要做深度、密集型计算分析的话,你最好用Hadoop或者类似于Verticaa的面向列的存储工具。在某些情况下RethinkDB会在一定程度上牺牲书写可用性(write availability)来保证数据一致性(data consistency)。如果高要求的书写可用性对你来讲很重要,那你也不要纠结了,像Riak这样的Dynamo式系统可能更适合你。想要更多地学习RethinkDB?阅读 ten-minute guide 开始学习RethinkDB。对于熟悉分布式系统的程序员可以直接阅读 architecture overview 。走捷径用 cookbook,你可以看到许多常用的 RethinkDB查询例子。 标签:分布式数据库
PostgreSQL是一个强大的开源对象关系数据库系统,它使用并扩展了SQL语言,并结合了许多安全存储和扩展最复杂数据工作负载的功能。它可以在所有主要操作系统上运行,并具有高度的可扩展性。PostgreSQL支持多种数据类型,包括数字、字符串、日期、数组、JSON、XML等。它还支持SQL的许多功能,如复杂查询、外键、触发器、视图、事务等。此外,PostgreSQL还具有许多高级功能,如索引优化、多版本并发控制(MVCC)、分区、安全性、可靠性和可扩展性等。它还支持多种编程接口,如C/C++、Java、Perl、Python、Ruby、Tcl和ODBC。总之,PostgreSQL是一个功能强大且灵活的数据库系统,适用于各种应用场景。\[2\]\[3\] #### 引用[.reference_title] - *1* *2* [PostgreSQL数据库基础知识](https://blog.csdn.net/weixin_30647065/article/details/101528775)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [PostgreSQL知识点](https://blog.csdn.net/ZHENhen_520/article/details/122156419)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值