![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
大数据
文章平均质量分 76
大数据相关
¥三石
提高赚钱能力,认真健身,认真生活。
展开
-
学习:名词定义 ETL 数据仓库
ETLetl是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一次较常用在数据仓库,但其对象并不限于数据仓库。数据仓库数据仓库,英文名称为Data WareHouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及转载 2020-09-11 08:53:13 · 255 阅读 · 0 评论 -
学习:名词定义 大数据 Saas Paas Iaas
大数据的定义:大数据(bigdata),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity原创 2020-07-06 11:14:07 · 1399 阅读 · 0 评论 -
flink spark
综上所述,flinkSQL和sparkSQL的性能只差一点点,flink是spark的最强大的竞争者。个人认为flink潜力很大。第一,flink主要是java写的代码,相比scala写的spark而言,flink的内存溢出问题更容易定位和优化。第二,flink是在idea环境开发的,而我主要就是用这个开发环境,非常方便。本人用sparkSQL两年来,数据倾斜,内存溢出问题见过太多,相当坑爹,而官方源码几乎很难打包编译调试。第三、flink更专业,spark就是综合rdd,sql,图计算,流式计算原创 2020-12-26 09:07:27 · 170 阅读 · 0 评论 -
转载:大数据学习路线
转载自 :大数据学习路线转载 2020-09-11 13:59:43 · 85 阅读 · 0 评论