Elasticsearch做到像mysql这样的表连接Parent-Child实现

比如在mysql中我有两张表,movies和ratings,这两张表依赖movie_id实现关联。
那么我需要在elasticsearch中实现一下两个任务

  • 电影标题为When Will I Be Loved的电影评分的均值是多少
  • 电影评分大于5的电影标题是什么
    可以看出来这两个问题都需要将movies和ratings这两张表表连接以后再进行查询。但是Elasticsearch不支持在查询的时候使用movies.movie_id=ratings.movie_id实现两张表的连接,在Elasticsearch的做法是使用Parent-Child实现定义好父文档与子文档。可以理解为例如movie_id为1的数据在movies表中成为父文档,在ratings中成为子文档。

定义索引结构以及定义父子关系

DELETE /movies_ratings_inde


PUT /movies_ratings_index
{
  "mappings": {
    "properties": {
      "movie_id": {"type": "keyword"},
      "movie_title": {"type": "keyword"}
    }
  }
}


PUT /movies_ratings_index/_mapping
{
  "properties": {
    "rating_score": {"type": "float"},
    "movie_id": {"type": "keyword"}
  }
}


# ratings就是表连接,其中movie是父,rating是子
PUT /movies_ratings_index/_mapping
{
  "properties": {
    "movie_id": {"type": "keyword"},
    "movie_title": {"type": "keyword"},
    "ratings": {
      "type": "join",
      "relations": {
        "movie": "rating"
      }
    }
  }
}

导入数据,我这里父数据定义了两条,movie_id分别是1和2,子数据定义了多个。


POST /movies_ratings_index/_doc/1
{
  "movie_id": "1",
  "movie_title": "When Will I Be Loved",
  "ratings": {
    "name": "movie"
  }
}

POST /movies_ratings_index/_doc/2
{
  "movie_id": "2",
  "movie_title": "When Will I Be Disdained",
  "ratings": {
    "name": "movie"
  }
}


POST /movies_ratings_index/_doc/3?routing=1
{
  "rating_score": 4.5,
  "movie_id": "1",
  "ratings": {
    "name": "rating",
    "parent": "1"
  }
}
POST /movies_ratings_index/_doc/4?routing=1
{
  "rating_score": 6.5,
  "movie_id": "1",
  "ratings": {
    "name": "rating",
    "parent": "1"
  }
}

POST /movies_ratings_index/_doc/5?routing=1
{
  "rating_score": 36.5,
  "movie_id": "1",
  "ratings": {
    "name": "rating",
    "parent": "1"
  }
}
POST /movies_ratings_index/_doc/6?routing=1
{
  "rating_score": 26.5,
  "movie_id": "1",
  "ratings": {
    "name": "rating",
    "parent": "1"
  }
}

POST /movies_ratings_index/_doc/7?routing=1
{
  "rating_score": 16.5,
  "movie_id": "1",
  "ratings": {
    "name": "rating",
    "parent": "1"
  }
}

POST /movies_ratings_index/_doc/8?routing=2
{
  "rating_score": 50,
  "movie_id": "2",
  "ratings": {
    "name": "rating",
    "parent": "2"
  }
}

问题1:使用has_parent,因为我们这里是对父数据的movie_title字段进行筛选数据。

#使用has_parent查询
GET /movies_ratings_index/_search
{
 
  "query": {
    "has_parent": {
      "parent_type": "movie",
      "query": {
        "match": {
          "movie_title": "When Will I Be Loved"
        }
      }
    }
  },
  "aggs": {
    "avg_rating_score": {
      "avg": {
        "field": "rating_score"
      }
    }
  }
}

问题2:使用has_child,因为我们这里是对孩子数据进行筛选。

#使用has_child查询
GET /movies_ratings_index/_search
{
  "query": {
    "has_child": {
      "type": "rating",
      "query": {
        "range": {
          "rating_score": {
            "gt": 6
          }
        }
      }
    }
  },
  "aggs": {
    "movies_with_high_ratings": {
      "terms": {
        "field": "movie_title.keyword",
        "size": 10  // 返回前10个最频繁出现的电影标题
      }
    }
  }
}

到这里能发现,就是说要想在elasticsearch中实现mysql的表连接操作必须要事先定义好父子关系,除此之外还要我这里只提到了两张表之间的关系,那么更多表的连接需要如何操作呢

  • 11
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

牛右刀薛面

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值