类目树与闭包表模型详细教程
在我们开发的很多项目中,都需要用到类目树,比如电商网站的商品分类、公司的组织结构、论坛的帖子评论层级等。类目树是一种层级化的数据结构,它的特点是每个节点(类目)都有父类目和子类目,形成一个类似“家谱”的树状结构。
类目树的常见场景:
- 电商分类:比如“电子产品”下有“手机”、“笔记本电脑”,“手机”下有“安卓手机”、“iPhone”。
- 组织架构:比如公司下有“技术部”、“市场部”,“技术部”下有“前端团队”、“后端团队”。
- 论坛帖子评论:每个主贴可以有回复,回复又可以有子回复。
什么是类目树?
类目树就是一个“父子”关系的层级树,比如以下商品分类:
电子产品
├── 手机
│ ├── 安卓手机
│ └── iPhone
└── 笔记本电脑
├── 游戏笔记本
└── 超轻薄笔记本
在这个类目树中,“电子产品”是顶级类目,下面有子类目“手机”和“笔记本电脑”,每个类目又有自己的子类目,比如“手机”下有“安卓手机”和“iPhone”。这就是一种典型的树形结构。
传统的类目树存储方式(邻接表模型)
最直观的方式是使用邻接表模型来存储类目树。每个类目有一个 parent_id
字段,表示它的父类目是谁。例如:
ID | 名称 | 父ID
----------------------
1 | 电子产品 | NULL
2 | 手机 | 1
3 | 笔记本电脑 | 1
4 | 安卓手机 | 2
5 | iPhone | 2
6 | 游戏笔记本 | 3
7 | 超轻薄笔记本 | 3
id
是类目的唯一标识。name
是类目的名称。parent_id
是类目的父类目 ID,顶级类目的父 ID 为NULL
。
这种方式简单易懂,但是查询性能较差。比如:
- 获取某个类目的所有子类目:你必须递归查询所有子节点,直到找到最底层的节点,效率很低。
- 获取某个类目的完整路径:需要从当前类目逐层向上查找,直到找到顶级类目,同样需要递归查询。
什么是闭包表模型?
为了解决这些查询效率低的问题,可以使用闭包表模型。闭包表提前存储了类目树中每个节点与它所有祖先和后代之间的关系,这样我们可以在查询时,直接从表中获取所有祖先、后代或完整路径,无需递归。
闭包表的结构
闭包表的设计很简单,它用三列来表示类目树中节点与祖先、后代的关系:
ancestor_id
:表示某个节点的祖先。descendant_id
:表示某个节点的后代。