很多数据库应用都必须面临非结构化数据存储的问题,这个问题对整个系统往往都是非常关键的。因此我们需要一个适合的方案,折中地考虑了性能、安全和稳定性等因素。本文简单地阐述了以SQL SERVER和ORACLE为数据库管理系统的应用系统的实现方案(注:仅是个人观点)。
其实不外乎两种实现方式:
1. 使用文件系统存储文件,而在数据库中存储访问路径。这种方式的优点是实现简单,不需要DBMS的高级功能,但是这种方式无法实现文件的事务性访问,不便于数据备份和恢复,不便于数据迁移等;
2. 使用DBMS的文件存储功能。比较常见的方式,如SQL SERVER中的FILESTREAM/BLOB,ORACLE中的BFILE/BLOB。这种方式克服了实现方式一的缺点,但是需要DBMS提供支持,也就是说这种方式的实现方式的控制权在DBMS厂商手中,DBMS实现的好则好,坏则坏。这种方式需要考虑的最重要的一点就是通过DBMS直接或间接地操作非结构化数据会不会生成过多的undo/redo,会不会影响整个系统的性能,会不会降低系统的并发程度等等。
我个人的观点是,实现方式1适合使用廉价存储、对事务访问以及备份等关注不多的或存储超大文件(几百M)的场景,其他的场景使用实现方式2会更合适一些。