使用嵌入式文档的一对多关系模型


进入MongoDB中文手册(4.2版本)目录

1 概述

本页描述了一种数据模型,该数据模型使用嵌入式文档来描述所连接数据之间的一对多关系。将连接的数据嵌入单个文档中可以减少获取数据所需的读取操作次数。通常,您应该对模式(schema)进行结构设计,以便您的应用程序可以在一次读取操作中接收所有必需的信息。

2 嵌入式文档模式(Pattern)

考虑以下映射顾客和多个地址关系的示例。该示例说明了如果您需要在另一个上下文中查看许多数据实体,则与引用相比,嵌入的优势。在patron与 address数据之间的一对多关系中,patron拥有多个address实体。
在规范化数据模型中,address文档包含对patron文档的引用。

// patron document
{
   _id: "joe",
   name: "Joe Bookreader"
}

// address documents
{
   patron_id: "joe", // reference to patron document
   street: "123 Fake Street",
   city: "Faketon",
   state: "MA",
   zip: "12345"
}

{
   patron_id: "joe",
   street: "1 Some Other Street",
   city: "Boston",
   state: "MA",
   zip: "12345"
}

如果您的应用程序经常检索包含name信息的address数据 ,则您的应用程序需要发出多个查询来解析引用。更好的方案是将address数据实体嵌入到patron数据中,如以下文档所示:

{
   "_id": "joe",
   "name": "Joe Bookreader",
   "addresses": [
                {
                  "street": "123 Fake Street",
                  "city": "Faketon",
                  "state": "MA",
                  "zip": "12345"
                },
                {
                  "street": "1 Some Other Street",
                  "city": "Boston",
                  "state": "MA",
                  "zip": "12345"
                }
              ]
 }

使用嵌入式数据模型,您的应用程序可以通过一个查询来检索完整的顾客信息。

3 子集模式(Subset Pattern)

嵌入式文档模式的潜在问题是,它可能导致产生大型文档,尤其是在嵌入式字段不受限制的情况下。在这种情况下,您可以使用子集模式来仅访问应用程序所需的数据,而不是整个嵌入式数据集。
考虑一个电子商务网站,其中列出了产品评论:

{
  "_id": 1,
  "name": "Super Widget",
  "description": "This is the most useful item in your toolbox.",
  "price": { "value": NumberDecimal("119.99"), "currency": "USD" },
  "reviews": [
    {
      "review_id": 786,
      "review_author": "Kristina",
      "review_text": "This is indeed an amazing widget.",
      "published_date": ISODate("2019-02-18")
    },
    {
      "review_id": 785,
      "review_author": "Trina",
      "review_text": "Nice product. Slow shipping.",
      "published_date": ISODate("2019-02-17")
    },
    ...
    {
      "review_id": 1,
      "review_author": "Hans",
      "review_text": "Meh, it's okay.",
      "published_date": ISODate("2017-12-06")
    }
  ]
}

评论按时间倒序排列。当用户访问产品页面时,应用程序将加载十条最近的评论。
您可以将一个集合分为两个集合,而不是将所有评论与产品一起存储:

  • product集合存储有关每个产品的信息,包括该产品的十个最新评论:
{
  "_id": 1,
  "name": "Super Widget",
  "description": "This is the most useful item in your toolbox.",
  "price": { "value": NumberDecimal("119.99"), "currency": "USD" },
  "reviews": [
    {
      "review_id": 786,
      "review_author": "Kristina",
      "review_text": "This is indeed an amazing widget.",
      "published_date": ISODate("2019-02-18")
    }
    ...
    {
      "review_id": 776,
      "review_author": "Pablo",
      "review_text": "Amazing!",
      "published_date": ISODate("2019-02-16")
    }
  ]
}
  • review集合存储了所有评论。每个评论都包含对其所撰写的产品的引用。
{
  "review_id": 786,
  "product_id": 1,
  "review_author": "Kristina",
  "review_text": "This is indeed an amazing widget.",
  "published_date": ISODate("2019-02-18")
}
{
  "review_id": 785,
  "product_id": 1,
  "review_author": "Trina",
  "review_text": "Nice product. Slow shipping.",
  "published_date": ISODate("2019-02-17")
}
...
{
  "review_id": 1,
  "product_id": 1,
  "review_author": "Hans",
  "review_text": "Meh, it's okay.",
  "published_date": ISODate("2017-12-06")
}

通过将最近的十条评论存储在product集合中,在调用product集合时仅返回所需的全部数据子集。如果用户希望查看其他评论,则应用程序将调用review集合。

提示
在考虑将数据拆分到哪里时,数据中最常访问的部分应该放在应用程序首先加载的集合中。在此示例中,模式被划分为十个评论,因为这是默认情况下在应用程序中可见的评论数。

也可以看看

3.1 子集模式的权衡

使用包含更频繁访问的数据的较小文档可以减小工作集的整体大小。这些较小的文档可提高应用程序最常访问的数据的读取性能。
但是,子集模式会导致数据重复。在该示例中,评论在product集合和 reviews集合中都维护。必须采取额外的步骤来确保每个集合之间的评论是一致的。例如,当客户编辑其评论时,应用程序可能需要执行两项写操作:一项用于更新product集合,另一项用于更新reviews集合。
您还必须在应用程序中实现逻辑,以确保product集合中的评论始终是该产品的十个最新评论。

3.2 其他示例的用例

除了产品评论外,子集模式还可以很好地存储:

  • 对博客文章发表评论时,默认情况下,您只想显示最新或评分最高的评论。
  • 电影中的演员,默认情况下只希望显示角色最大牌的演员。

进入MongoDB中文手册(4.2版本)目录

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值