【techtarget中国原创】要理解xml shredding的概念,可以参考下面的图示。在这个例子中,xml文档中包含了客户名称、地址以及电话等信息,它们被映射到两个关系表当中。文档可以包含多个电话元素,因为客户与电话是一对多的关系(手机、家庭座机、办公室座机)。所以,电话号码就被拆分到一个单独的表当中。在关系型目标架构中,每一个重复的元素(如电话信息)都可以分配到额外的一个表当中。假设客户信息还包含多个email地址、多个账户、最近订单列表以及每个订单对应的多种商品等重复元素,那么关系型目标架构中的表数量将急剧增加。将xml文档拆分成数量巨大的表,你的逻辑业务对象中会产生复杂的碎片,直接导致应用程序开发的难度与出错率提升。而查询拆分的数据或重新组装原始文档需要复杂的多路连接。
【techtarget中国原创】要理解xml shredding的概念,可以参考下面的图示。在这个例子中,xml文档中包含了客户名称、地址以及电话等信息,它们被映射到两个关系表当中。文档可以包含多个电话元素,因为客户与电话是一对多的关系(手机、家庭座机、办公室座机)。所以,电话号码就被拆分到一个单独的表当中。在关系型目标架构中,每一个重复的元素(如电话信息)都可以分配到额外的一个表当中。假设客户信息还包含多个email地址、多个账户、最近订单列表以及每个订单对应的多种商品等重复元素,那么关系型目标架构中的表数量将急剧增加。将xml文档拆分成数量巨大的表,你的逻辑业务对象中会产生复杂的碎片,直接导致应用程序开发的难度与出错率提升。而查询拆分的数据或重新组装原始文档需要复杂的多路连接。
xml 文档拆分示例图
相反地,根据xml文档的复杂程度、可变性以及用途,适当地进行拆分或许也是一个不错的选择。下表总结了将xml文档拆分成关系表的优缺点。
在许多xml应用场合,xml数据的结构与使用率都决定了拆分工作的困难。这也就是为什么db2支持xml列,使得用户无需转换就可以对xml数据进行索引与查询。有些时候,你会发现部分拆分或xml混合存储可以最大地满足你的应用需求。
部分拆分的概念,就是将xml文档中元素或属性的一个子集拆分成关系表。当应用不需要xml的所有数据值时,这样的方法将很有效。 xml混合存储就是当向一个xml列插入一个xml文档时,抽取选定的元素或属性并将它们冗余存储在关系列中。无论你选择全部拆分还是部分拆分xml文档,db2都提供强大的功能,可以实现以下效果:
再插入关系列之前,执行数据值的自定义转化。 将相同的元素或属性拆分到表的多个列中。 将不同的元素或属性拆分到表的同一列中。 指定条件来管理是否对相应元素进行拆分。 在拆分过程中使用xml schema进行xml文档验证。 同拆分数据一同存储完整xml文档。