大数据数仓建模
数据仓库简介
1.什么是数据库?
数据库(database)是按照数据结构来组织,存储和管理数据的建立在计算机存储设备上的仓库。
数据库是长期存储在计算机内,有组织的,可共享的数据集合。数据库中的数据指的是以一定的数据模型组织,描述和
存储在一起,具有尽可能小的冗余度,较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享。
常用的数据库有mysql,oracle,sqlserver等。作用不一样,数据库是用来支撑业务(1)的,需要响应速度特别快,没
有延时,查询起来都是一条条查询,把相关的数据全部得到,适合用这种关系型数据库。数据仓库主要用来支撑分析的。
问题:公司的多个部门,对相同的数据描述会不一样,在汇总的时候会出问题。
(1)什么是业务:
系统会和自己用户打交道的系统,为业务系统。滴滴打车,乘客(叫车,上车,确定上车,确认达到,好评),司机,
自己公司的员工,公司就会开发出配套的it系统,
公司的一个员工:
考勤系统,都需要有对应的数据库做支持
财务系统,都需要有对应的数据库做支持
oa系统(自动化办公