存储XML格式数据的原理

同其他数据格式相比,XML的一大优点就是它非常类似对象数据结构。由于目前的程序设计和开发大多是面向对象的,所以用XML来表达数据可以让数据的处理和传播变得非常方便。可是,在用XML存储数据的时候却可能会遇到点麻烦,现在就让我们来看看用存储XML格式的数据到底会出现什么问题。
对象持久化所面临的问题


把二进制数据对象(比如Java类等)存储在数据库里就叫做数据的持久化(persistence)。对运行中的程序实例对象进行持久化就不需要对象在其全部使用期内始终驻留在内存里。我们可以设想一下,假如某个大型金融计算系统每天要处理成千上万的交易事务,如果把交易中产生的所有这些对象数据都驻留在内存里不仅会令系统处理效率非常低,而且对系统本身也具有一定的破坏性。为了解决这种由数据规模庞大所带来的问题,对象在没有即时使用的时候就应该存储在内存以外的地方。在需要再次用到对象的时候完全可以从存储数据中重新实例化对象并接受系统的处理。

因为数据对象必须以某种确定的方式持久化,所以被存储的数据必须在数据库里用一定的数据格式表示。解决这个问题有好几种方法,但这些方法都有其严重的缺陷。比方说,在关系数据库模式下,我们可以采用映射算法把对象映射到一个或者多个数据表中。这样做的优点是充分利用了现有的存储技术。缺点是每块数据都必须和数据库不断地来回映射,这种映射处理对数据的完整性和性能都会带来负面影响。

用XML格式存储数据对象

另一种方法可以有效地避免映射算法所带来的性能问题,这就是采用XML。只需要使用一个确定了一些键字段的数据表,你就可以创建必要的对象查找和索引。然后,你可以采用二进制大型对象(BLOB :Binary Large Object)字段,把整个对象存储为经串行化处理之后的XML字符串。大多数数据库都支持BLOB字段来处理大型二进制数据字段和其他规模不定的原始数据格式(比如XML文档等)。

串行化(Serialization)就是把复合型数据结构(比如对象等)转换为一系列有明确定义元素的过程(换句话说,就是把对象的数据元素转换为一系列代表对象内部数据的XML元素)。存储在数据库内的这个数据集合就定义了对象的状态。

这样,只要你定义了包含所有对象结构化数据的XML文件类型定义DTD(Document Type Definition),你就可以创建一个XML文档,用这个文档表示你想串行化的对象实例。再通过BLOB数据字段的应用,你就可以放心地存储这个XML数据而无须担心传统字段类型大小这一局限性了。

串行化解决方案

XML有助于简化对象的持久化过程,使数据的持久化成为一个普通的开发过程。通过把数据对象串行化为XML文档,你就可以创建对象文档,然后再采用BLOB字段类型就可以在数据库中方便地存储XML文档了。

本文转自: http://developer.e800.com.cn/articles/2006/20/23924623_1.html

 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值