在应用开发中,树状结构得数据是经常被用到得,比如省-市-县这样得位置数据,还有论坛发贴盖楼这样得数据,描述成树形都非常形象,但怎么存储树形数据有时候却是个问题。
有人写过一个在RDMS中存储树形结构数据得文章,managing-hierarchical-data-in-mysql 可在此下载:http://download.csdn.net/download/largetalk/3929259
文中得两种方法一是邻接表模型,即用一个父节点指针来指向父节点,另一个是嵌套集合模型,也即左右间值编码方式。
两种方式都有优缺点, 邻接表方法是简单易懂,修改子树方便效率高,缺点是查询子树比较麻烦,查询时层级有限制,不适合存储有无限层得数据
左右间值法胜在查询子树方便,可以无限层级,缺点就是增删改节点代价比较大,都需要锁表,这在高并发得情况下是不能忍受得
因此,我觉得这两种结构都有它们各自得用途和局限性
邻接表适合那些层次不深,会对子节点修改比较多,但层次变化比较小得地方
左右间值可以应对无限层次得情况,用在层次比较多但数据稳定得地方比较好
它们都有同一个局限性,即满足不了高并发业务得需求,或者说这是RDMS得局限性。对于这种需求,不需要修改得数据就直接生成树状数据结构直接cache住,如果需要改得话就上NoSQL。但NoSQL虽然快却也不是万能得,同一时间并发修改得请求多得话就要把热点分散开来,这和业务就相关了。
有人写过一个在RDMS中存储树形结构数据得文章,managing-hierarchical-data-in-mysql 可在此下载:http://download.csdn.net/download/largetalk/3929259
文中得两种方法一是邻接表模型,即用一个父节点指针来指向父节点,另一个是嵌套集合模型,也即左右间值编码方式。
两种方式都有优缺点, 邻接表方法是简单易懂,修改子树方便效率高,缺点是查询子树比较麻烦,查询时层级有限制,不适合存储有无限层得数据
左右间值法胜在查询子树方便,可以无限层级,缺点就是增删改节点代价比较大,都需要锁表,这在高并发得情况下是不能忍受得
因此,我觉得这两种结构都有它们各自得用途和局限性
邻接表适合那些层次不深,会对子节点修改比较多,但层次变化比较小得地方
左右间值可以应对无限层次得情况,用在层次比较多但数据稳定得地方比较好
它们都有同一个局限性,即满足不了高并发业务得需求,或者说这是RDMS得局限性。对于这种需求,不需要修改得数据就直接生成树状数据结构直接cache住,如果需要改得话就上NoSQL。但NoSQL虽然快却也不是万能得,同一时间并发修改得请求多得话就要把热点分散开来,这和业务就相关了。