数据库,数据仓库,数据中台这些关于数据的概念性的东西,对于初学者来讲,非常容易混淆。
在使用计算机的过程中,我们经常会遇见需要进行数据存储的场景,比如,通讯录数据,进销存数据。在数据量不是特别大的时候,我们通常采用excel文件形式、txt文件、word文档等形式来存储数据。当数据量越来越大时,这种个人常用的数据存储方式会变得不太方便更新,不方便查询等,因此,需要一种数据管理工具,对这些零散的数据进行管理。
一、数据库
数据库以一定的方式将数据存储在一起的、能提供给多个用户共享的数据集合。它给用户提供了另外一种数据管理的方式,它能根据用户需求,将数据按照一定的规律进行存储。如果将前面讲到的通讯录比喻成一本书,那么数据库就是电子化的书柜,给用户提供便捷的增删查改等操作。常见的数据库关系型数据库有mysql,sqlserver,db2等;
二、数据仓库
数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合。相对于数据库来讲,数据仓库存储的数据针对性更强,且一般不太更新,而是对历史数据进行累积,所以,它的另一特性就是可以反应数据的历史变化。
面向主题的(Subject Oriented):在较高层次上将企业信息系统中数据进行综合、归类分析利用。属于一个抽象概念,每一个主题基本对应一个宏观分析领域。主题(Subject)是对应企业中某一宏观分析领域所涉及的分析对象(重点是分析的对象&