本文章主要介绍ETL和大数据中涉及到名词,同时解释这些名词的含义。由于不是一次性收集这些名词,所以这篇文章将会持续更新,更新日志会存放在本段话下面:
12-19更新:OLTP、OLAP、BI、ETL。
12-20更新:ELT、EII
1. OLTP
中文称呼:在线事务处理系统。
主要功能:对数据进行增删改查,特性是事物的吞吐量。面向的业务主要涉及到的是常用的软件信息存储等等。
2. OLAP
中文称呼:联机分析处理系统。
主要功能:偏向于数据的查询,特性是查询效率。面向的主要是决策分析,关键数据提取汇总等等。
3. BI
中文称呼:商业智能(常常听见过BI报表开发有没有?)
主要功能:使用ETL清洗数据,整合数据仓库,提取数据,完成数据的展现,打破信息壁垒。换个角度来说,BI更像是ETL+数仓+其他技术的一个综合体。
4. ETL
中文称呼:数据清洗(E:抽取+T:转换+L:加载)
主要功能:将数据从OLTP系统中转移到数据仓库中的一系列操作的集合。
5. ELT
中文称呼:抽取、加载、转换
主要功能:ELT与ETL还是有所不同的,所以我在这里还是要记录一下ELT,它的主要功能是:数据首先从源数据进行抽取和加载(ETL是先抽取再转换),再转换成需要的格式,这样做的好处在于,把高吞吐的工作交给数据库来做,减轻高吞吐负担。
6.EII
中文称呼:虚拟数据整合
主要功能:EII目前基本上很少有人用了,EII的侧重点在于对用户的数据展示上,数据的加载转换不是它所注意的。