数据仓库和数据库的区别

数据仓库和数据库的区别

首先你要了解企业中的一个问题
比如:java人员 爬虫了一些数据,我们大数据拿来用 但是最终的结果出现了错误
这时大数据人员说 java爬的数据有问题 java人员说他爬的数据没有问题
是大数据的问题 这就是公司中出现的拉皮条显现【推卸责任】

企业数据文件管理的真谛:方便快速的存储和快速的提取。
方式:分类管理
--根据文件不同属性划分不同文件夹
–相同属性文件再根据日期继续划分

数据质量检查:在进行数据分析之前 需要通过相关的标准指标判断评估数据是否符合本次分析 数据的好坏不再于多少 在于数据是否符合你的分析需求

数据仓库和数据库的区别?
数据仓库(data warehouse) 可以简写为dw或者dwh.数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策和支持。它出于分析性报告和决策支持的目的而建设。
而且
*数据仓库本身并不“生产数据”也不“消费数据”,**数据来源于外部开放于外部应用,这也就是为什么叫“仓库”而不叫“工厂”
数据仓库的主要特征:面向主题的/集成的/非易失的(不可更新的)/时变的数据集合,用于支持管理决策。

数据仓库的非易失:
操作型数据库主要服务于日常的业务操作,使得数据库需要不断地对数据实
时更新
,以便迅速获得当前最新数据,不至于影响正常的业务运作。在数据仓库
中只要保存过去的业务数据,不需要每一笔业务都实时更新数据仓库,而是根据
商业需要每隔一段时间把一批较新的数据导入数据仓库。

重点解说:数据库和数据仓库的区别
数据仓库和数据库的区别 就是OLTP【on-line transaction processing】和OLAP【on-line analytical processing】的区别:联机事务处理/联机分析处理
数据库是面向事务的设计,数据仓库是面向主题的设计的。
数据库一般存储业务数据,数据仓库一般存储的是历史数据。
数据库是为了捕获数据而设计,数据仓库是为了分析数据而设计。

数据库看重的是响应 安全和高并发。

数据仓库:
–具备数据存储的能力
–具备数据(ETL)分析的能力
元数据(Meta Date),主要记录数据仓库中模型的定义、各层级间的映射关
系、监控数据仓库的数据状态及 ETL 的任务运行状态。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值