自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 问答 (1)
  • 收藏
  • 关注

原创 2021-06-21

HIVE概念1) 数据仓库的基本概念:数据库: 存储数据的仓库 一般都是面向于业务系统 主要用于对接业务系统 用于捕获数据 一般要求交互式极强 一般存储业务数据 都要经常进行数据CURD数据仓库: 存储数据的仓库 一般面向于主题(面向于分析) 主要是用于数据分析 一般对交互式没有太大要求 一般是用于存储过去以及既定发生过数据, 一般进行数据的查询数据仓库主要目的, 是对过去的数据进行分析, 从而对未来发展提供决策支持2) 数据仓库的特征:1.主题性 : 面向于分析的主题, 分析的需要是

2021-06-21 15:56:03 80 1

原创 Flink初探

Flink背景介绍Flink 诞生于欧洲的一个大数据研究项目 StratoSphere。该项目是柏林工业大学的一个研究性项目。早期, Flink 是做 Batch 计算的,但是在 2014 年, StratoSphere 里面的核心成员孵化出 Flink,同年将 Flink 捐赠 Apache,并在后来成为 Apache 的顶级大数据项目,同时 Flink 计算的主流方向被定位为 Streaming, 即用流式计算来做所有大数据的计算,这就是 Flink 技术诞生的背景。2014 年 Flink 作为主

2021-01-17 23:31:16 129

原创 kafka基础知识

kafuka基础知识什么是kafka?Kafka是分布式发布-订阅消息系统,它最初是由LinkedIn公司开发的,之后成为Apache项目的一部分,Kafka是一个分布式,可划分的, 冗余备份的持久性的日志服务,它主要用于处理流式数据。kafka的设计初衷:​ 1.能够应对海量实时消息数据–高吞吐,低延时​ 2.需要有分布式的系统特征:高可用,水平扩展kafka的核心概念,名词解释1.Broker:代理,就是kafka的一台节点2.Producer:生产者,向kafka推送消息的角色

2020-12-25 23:55:23 1724 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除